大模型推理能力的边界 当前,大语言模型在各种任务中展现出了令人惊叹的能力,从写文章到写代码,从翻译到对话,似乎无所不能。但在实际业务应用中,很多企业发现这些“聪明”的模型在某些场景下会犯一些让人哭笑不得的错误,甚至给出完全不合逻辑的答案。 知识库 2025年10月06日 0 点赞 0 评论 111 浏览
百度文心X1价格战亮剑!API费用仅为DeepSeek-R1五分之一,逼宫国产模型市场 最近,百度文心大模型抛出了一枚"价格炸弹":其主力API调用费用直接降至市场同类产品的五分之一,特别是针对深度求索的DeepSeek-R1形成了直接的价格压制。这不仅仅是两家技术公司的商业竞争,更可能重塑整个国产大模型市场的游戏规则。 知识库 2025年08月21日 0 点赞 0 评论 168 浏览
从响应到查询:语言模型中逆向思维的力量 在一篇新论文《时间反转为 LLM 提供无监督反馈》中,来自 Google DeepMind 和印度科学研究所的研究团队提出了时间反转语言模型 (TRLM),这是一个允许 LLM 反向推理的框架——以与传统正向方法相反的方式评分和生成内容。 AI资讯 2025年07月04日 0 点赞 0 评论 186 浏览
Adobe Research 使用状态空间模型解锁视频世界模型中的长期记忆 通过将用于高效远程依赖建模的状态空间模型 (SSM) 与用于一致性的密集局部注意力相结合,并使用扩散强迫和框架局部注意力等训练策略,Adobe Research 的研究人员成功地克服了视频生成中长期记忆的长期挑战。 AI资讯 2025年06月19日 0 点赞 0 评论 223 浏览
【万字长文】大模型训练推理和性能优化算法总结和实践 阿里云公共云 AI 汽车行业大模型技术团队,致力于通过专业的全栈 AI 技术推动 AI 的落地应用。 技术开发 2025年09月30日 0 点赞 0 评论 247 浏览
AI大模型技术解析:从原理到应用场景全指南 在人工智能技术快速发展的今天,AI大模型已成为推动产业变革的核心驱动力。本文将深入解析大模型的技术原理、训练方法及典型应用场景,帮助读者全面了解这一前沿技术领域。 知识库 2025年07月23日 0 点赞 0 评论 197 浏览
腾讯混元大模型 深度解析腾讯混元大模型核心技术:混元T1推理架构、Turbo S快思考引擎、文生3D开源方案。涵盖API调用教程、游戏/医疗/工业场景案例,附免费体验入口与部署资源。 AI 大模型 2025年06月27日 0 点赞 0 评论 2748 浏览
23招教你掌握大模型提示词技巧 推理成本直降80%的Deepseek-R1横空出世,OpenAI对GPT-4o进行了迭代更新,马斯克的xAI推出Grok 3模型并声称性能超越ChatGPT ......在这场技术地震中,最引人注目的当属完全开源的DeepSeek。 技术开发 2025年03月17日 0 点赞 0 评论 530 浏览
大模型训练秘籍:数据、算法与算力的黄金三角 在人工智能领域,大模型的训练效果取决于三个核心要素:高质量的数据、先进的算法和强大的算力。这三者构成了大模型训练的黄金三角,缺一不可。其中,数据的质量与规模尤为关键。优质数据能显著提升模型的理解和生成能力,而数据不足或质量低下则会导致模型表现不佳,甚至产生偏见和错误输出。 知识库 2025年07月23日 0 点赞 0 评论 153 浏览
盘古大模型 深度解析盘古大模型5.5架构:5+N+X分层模型、Triplet Transformer预测引擎、快慢思考机制。涵盖API调用、矿山/医药/能源场景案例,附开源模型部署指南。 AI 大模型 2025年06月30日 1 点赞 0 评论 1042 浏览