Adobe Research 使用状态空间模型解锁视频世界模型中的长期记忆 通过将用于高效远程依赖建模的状态空间模型 (SSM) 与用于一致性的密集局部注意力相结合,并使用扩散强迫和框架局部注意力等训练策略,Adobe Research 的研究人员成功地克服了视频生成中长期记忆的长期挑战。 AI资讯 2025年06月19日 0 点赞 0 评论 268 浏览
大模型推理能力的边界 当前,大语言模型在各种任务中展现出了令人惊叹的能力,从写文章到写代码,从翻译到对话,似乎无所不能。但在实际业务应用中,很多企业发现这些“聪明”的模型在某些场景下会犯一些让人哭笑不得的错误,甚至给出完全不合逻辑的答案。 知识库 2025年10月06日 0 点赞 0 评论 169 浏览
百度文心X1价格战亮剑!API费用仅为DeepSeek-R1五分之一,逼宫国产模型市场 最近,百度文心大模型抛出了一枚"价格炸弹":其主力API调用费用直接降至市场同类产品的五分之一,特别是针对深度求索的DeepSeek-R1形成了直接的价格压制。这不仅仅是两家技术公司的商业竞争,更可能重塑整个国产大模型市场的游戏规则。 知识库 2025年08月21日 0 点赞 0 评论 220 浏览
从响应到查询:语言模型中逆向思维的力量 在一篇新论文《时间反转为 LLM 提供无监督反馈》中,来自 Google DeepMind 和印度科学研究所的研究团队提出了时间反转语言模型 (TRLM),这是一个允许 LLM 反向推理的框架——以与传统正向方法相反的方式评分和生成内容。 AI资讯 2025年07月04日 0 点赞 0 评论 227 浏览
【万字长文】大模型训练推理和性能优化算法总结和实践 阿里云公共云 AI 汽车行业大模型技术团队,致力于通过专业的全栈 AI 技术推动 AI 的落地应用。 技术开发 2025年09月30日 0 点赞 0 评论 287 浏览
AI大模型技术解析:从原理到应用场景全指南 在人工智能技术快速发展的今天,AI大模型已成为推动产业变革的核心驱动力。本文将深入解析大模型的技术原理、训练方法及典型应用场景,帮助读者全面了解这一前沿技术领域。 知识库 2025年07月23日 0 点赞 0 评论 242 浏览
腾讯混元大模型 深度解析腾讯混元大模型核心技术:混元T1推理架构、Turbo S快思考引擎、文生3D开源方案。涵盖API调用教程、游戏/医疗/工业场景案例,附免费体验入口与部署资源。 AI 大模型 2025年06月27日 0 点赞 0 评论 3181 浏览
23招教你掌握大模型提示词技巧 推理成本直降80%的Deepseek-R1横空出世,OpenAI对GPT-4o进行了迭代更新,马斯克的xAI推出Grok 3模型并声称性能超越ChatGPT ......在这场技术地震中,最引人注目的当属完全开源的DeepSeek。 技术开发 2025年03月17日 0 点赞 0 评论 570 浏览
大模型在医疗中的应用与风险 想象一下,一位医生每天需要阅读几十份病历、研究最新医学文献、同时还要为复杂病例寻找最佳治疗方案——这几乎是超人才能完成的任务。而现在,人工智能大模型正在尝试成为医生的"超级助手",但这条路上既有希望也有挑战。 知识库 2025年10月02日 0 点赞 0 评论 166 浏览
大模型训练秘籍:数据、算法与算力的黄金三角 在人工智能领域,大模型的训练效果取决于三个核心要素:高质量的数据、先进的算法和强大的算力。这三者构成了大模型训练的黄金三角,缺一不可。其中,数据的质量与规模尤为关键。优质数据能显著提升模型的理解和生成能力,而数据不足或质量低下则会导致模型表现不佳,甚至产生偏见和错误输出。 知识库 2025年07月23日 0 点赞 0 评论 191 浏览