OpenAI Codex 深度解析Codex核心功能:云端智能体并行处理、AGENTS.md配置、192K长上下文代码分析。涵盖ChatGPT集成教程、Codex CLI本地部署、金融/自动驾驶应用案例及API定价策略。 AI 大模型 2025年06月30日 0 点赞 0 评论 90 浏览
DeepSeek 为下一代 R2 模型提供信号,推出使用 SPCT 扩展推理的新方法 DeepSeek AI 是大型语言模型领域的杰出参与者,最近发表了一篇研究论文,详细介绍了一种新技术,旨在增强一般奖励模型 (GRM) 在推理阶段的可扩展性。 AI资讯 2025年07月07日 0 点赞 0 评论 71 浏览
AI大模型技术解析:从原理到应用场景全指南 在人工智能技术快速发展的今天,AI大模型已成为推动产业变革的核心驱动力。本文将深入解析大模型的技术原理、训练方法及典型应用场景,帮助读者全面了解这一前沿技术领域。 知识库 2025年07月23日 0 点赞 0 评论 70 浏览
麻省理工学院研究人员推出“SEAL”:迈向自我改进的 AI 的新步骤 MIT 推出了 SEAL,这是一个框架,使大型语言模型能够通过强化学习进行自我编辑和更新其权重。 AI资讯 2025年06月20日 0 点赞 0 评论 63 浏览
Adobe Research 使用状态空间模型解锁视频世界模型中的长期记忆 通过将用于高效远程依赖建模的状态空间模型 (SSM) 与用于一致性的密集局部注意力相结合,并使用扩散强迫和框架局部注意力等训练策略,Adobe Research 的研究人员成功地克服了视频生成中长期记忆的长期挑战。 AI资讯 2025年06月19日 0 点赞 0 评论 57 浏览
浅聊一下,大模型应用架构 | 工程研发的算法修养系列(二) 大语言模型(LLM)作为现代AI应用的核心组件,具有独特的技术特性和能力边界,理解这些基础对架构设计至关重要。 技术开发 2025年06月06日 0 点赞 0 评论 56 浏览
从响应到查询:语言模型中逆向思维的力量 在一篇新论文《时间反转为 LLM 提供无监督反馈》中,来自 Google DeepMind 和印度科学研究所的研究团队提出了时间反转语言模型 (TRLM),这是一个允许 LLM 反向推理的框架——以与传统正向方法相反的方式评分和生成内容。 AI资讯 2025年07月04日 0 点赞 0 评论 48 浏览
从标记到概念:Meta 在多语言 AI 中引入大型概念模型 Meta 的一个研究团队引入了大型概念模型 (LCM),这是一种在更高语义级别处理输入的新型架构。这种转变使 LCM 能够实现跨语言的显著零样本泛化,其性能优于同等规模的现有 LLM。 AI资讯 2025年07月03日 0 点赞 0 评论 48 浏览
探索大模型时代:如何利用AI提升企业智能化水平 在数字化转型浪潮中,人工智能技术正重塑企业运营模式。大模型作为AI领域的重要突破,为企业智能化升级提供了全新路径。如何有效利用AI技术提升企业竞争力?以下从战略规划到落地实践提供系统性方法论。其中,构建AI-native组织架构尤为关键。通过重构业务流程与组织形态,企业能充分发挥大模型在知识管理、决策优化和自动化方面的潜力,实现从传统运营向智能驱动的跨越式发 知识库 2025年07月23日 0 点赞 0 评论 46 浏览