盘古大模型 深度解析盘古大模型5.5架构:5+N+X分层模型、Triplet Transformer预测引擎、快慢思考机制。涵盖API调用、矿山/医药/能源场景案例,附开源模型部署指南。 AI 大模型 2025年06月30日 1 点赞 0 评论 339 浏览
GRPO 的效率可以提高 10 倍吗?快手 AI 的 SRPO 建议 SRPO 是 Kwai AI 的 SRPO 框架将 LLM RL 后训练步骤削减了 90%,同时在数学和代码方面与 DeepSeek-R1 的性能相当。这种具有历史重采样的两阶段 RL 方法克服了 GRPO 的限制。 AI资讯 2025年06月27日 0 点赞 0 评论 75 浏览
从响应到查询:语言模型中逆向思维的力量 在一篇新论文《时间反转为 LLM 提供无监督反馈》中,来自 Google DeepMind 和印度科学研究所的研究团队提出了时间反转语言模型 (TRLM),这是一个允许 LLM 反向推理的框架——以与传统正向方法相反的方式评分和生成内容。 AI资讯 2025年07月04日 0 点赞 0 评论 61 浏览
超越 Next-Token Prediction?Meta 的新型架构引发了关于大型语言模型未来的辩论 Meta AI 最近的研究引入了 BLT 架构,消除了分词器以改进多模态处理,以及大型概念模型 (LCM),该模型在语义“概念”而不是标记上运行,以实现更像人类的推理和更好的跨语言泛化。这些创新挑战了 LLM 中传统的 “next-token prediction” 范式。 AI资讯 2025年06月30日 0 点赞 0 评论 74 浏览