资讯中心 - 在线工具-免费在线AI工具平台

Meta 的一个研究团队引入了大型概念模型（LCM），这是一种在更高语义级别处理输入的新型架构。这种转变使 LCM 能够实现跨语言的显著零样本泛化，其性能优于同等规模的现有 LLM。

AI资讯 2025年07月03日 0 点赞 0 评论 375 浏览

Zhipu.AI 开源更快的 GLM 模型（速度提高 8 倍），推出 Z.ai，旨在全球扩张，可能在 IPO 之前。

AI资讯 2025年07月01日 0 点赞 0 评论 447 浏览

Meta AI 最近的研究引入了 BLT 架构，消除了分词器以改进多模态处理，以及大型概念模型（LCM），该模型在语义“概念”而不是标记上运行，以实现更像人类的推理和更好的跨语言泛化。这些创新挑战了 LLM 中传统的 “next-token prediction” 范式。

AI资讯 2025年06月30日 0 点赞 0 评论 466 浏览

推出 fasttransform，这是一个 Python 库，它通过多次分派的强大功能使数据转换可逆和可扩展。

AI资讯 2025年06月28日 0 点赞 0 评论 373 浏览

今天，腾讯混元开源首个混合推理MoE模型Hunyuan A13B，小身材拥有大智慧——

技术开发 2025年06月27日 0 点赞 0 评论 440 浏览

Kwai AI 的 SRPO 框架将 LLM RL 后训练步骤削减了 90%，同时在数学和代码方面与 DeepSeek-R1 的性能相当。这种具有历史重采样的两阶段 RL 方法克服了 GRPO 的限制。

AI资讯 2025年06月27日 0 点赞 0 评论 406 浏览

字节跳动推出 Astra，这是一种创新的双模型架构，彻底改变了复杂室内环境中的机器人导航。

AI资讯 2025年06月25日 0 点赞 0 评论 540 浏览

AI 视频生成格局正在从能力转变为盈利能力，挑战 OpenAI Sora 的主导地位。竞争对手在质量和效率方面正在超越 Sora，用户更喜欢替代品。现在的重点是改进，例如针对实际应用的精确控制和样式自定义。

AI资讯 2025年06月23日 0 点赞 0 评论 397 浏览

“自动故障归因”是 Multi-Agent 系统开发生命周期中的关键组成部分。它有可能将识别“出了什么问题以及谁应该负责”的挑战从一个令人困惑的谜团转变为一个可量化和可分析的问题

技术开发 2025年06月20日 1 点赞 0 评论 416 浏览

MIT 推出了 SEAL，这是一个框架，使大型语言模型能够通过强化学习进行自我编辑和更新其权重。

AI资讯 2025年06月20日 0 点赞 0 评论 392 浏览

资讯中心

首页

资讯中心