GRPO 的效率可以提高 10 倍吗?快手 AI 的 SRPO 建议 SRPO 是 Kwai AI 的 SRPO 框架将 LLM RL 后训练步骤削减了 90%,同时在数学和代码方面与 DeepSeek-R1 的性能相当。这种具有历史重采样的两阶段 RL 方法克服了 GRPO 的限制。 AI资讯 2025年06月27日 0 点赞 0 评论 80 浏览
字节跳动推出 Astra:用于自主机器人导航的双模型架构 字节跳动推出 Astra,这是一种创新的双模型架构,彻底改变了复杂室内环境中的机器人导航。 AI资讯 2025年06月25日 0 点赞 0 评论 83 浏览
AI 视频生成竞赛从能力转向盈利能力,挑战 Sora 的主导地位 AI 视频生成格局正在从能力转变为盈利能力,挑战 OpenAI Sora 的主导地位。竞争对手在质量和效率方面正在超越 Sora,用户更喜欢替代品。现在的重点是改进,例如针对实际应用的精确控制和样式自定义。 AI资讯 2025年06月23日 0 点赞 0 评论 88 浏览
麻省理工学院研究人员推出“SEAL”:迈向自我改进的 AI 的新步骤 MIT 推出了 SEAL,这是一个框架,使大型语言模型能够通过强化学习进行自我编辑和更新其权重。 AI资讯 2025年06月20日 0 点赞 0 评论 99 浏览
Adobe Research 使用状态空间模型解锁视频世界模型中的长期记忆 通过将用于高效远程依赖建模的状态空间模型 (SSM) 与用于一致性的密集局部注意力相结合,并使用扩散强迫和框架局部注意力等训练策略,Adobe Research 的研究人员成功地克服了视频生成中长期记忆的长期挑战。 AI资讯 2025年06月19日 0 点赞 0 评论 80 浏览
DeepSeek 推出 DeepSeek-Prover-V2:通过递归证明搜索和新基准测试推进神经定理证明 DeepSeek AI 发布了 DeepSeek-Prover-V2,这是一个用于精益 4 定理证明的开源 LLM。它使用 DeepSeek-V3 的递归证明搜索来训练数据和强化学习,在 MiniF2F 上取得了最好的结果。 AI资讯 2025年06月18日 0 点赞 0 评论 83 浏览
为什么高质量数据是代理AI成功的命脉:5大核心理由 深入解析为什么高质量数据是代理AI(Agent AI)成功的基石。揭示数据质量如何决定AI决策准确性、用户体验、公平性、运行效率及长期进化能力。避免“垃圾进,垃圾出”,提升您的AI项目价值! AI资讯 2025年06月04日 0 点赞 0 评论 69 浏览
当AI输出答案时,它真的在"理解"知识吗?——论大模型能力的本质与认知误区 深度解析大语言模型生成答案的本质:为何AI的知识输出只是统计模式匹配?本文通过医疗咨询、物理推导等6大典型案例,揭示大模型在逻辑推理、价值判断等维度的认知断层,并给出检索增强生成(RAG)、神经符号系统等前沿解决方案,助您规避AI知识幻觉风险,掌握人机协作的关键边界。 AI资讯 2025年05月15日 1 点赞 0 评论 154 浏览
为什么高质量数据对于代理 AI 至关重要 Agentic AI 正在成为企业运营中的一种变革性技术。在本文中,我们将概述什么是 AI 代理,介绍代理 AI 的一些企业用例,并解释为什么数据质量是影响 AI 计划(代理和其他)成功和投资回报率的主要因素。 AI资讯 2025年05月14日 0 点赞 0 评论 128 浏览
2025年5月11日AI热门资讯 每日推送 AI 领域新鲜资讯,实时追踪 AI 技术创新、企业动态与政策变化。结合深度分析与数据洞察,帮助读者快速获取有价值的 AI 知识,把握智能时代发展机遇。 AI资讯 2025年05月11日 0 点赞 0 评论 136 浏览