书生大模型 书生通用大模型(Intern)是由上海人工智能实验室主导,联合商汤科技、清华大学、香港中文大学、上海交通大学共同研发的多模态多任务通用大模型体系。 AI 大模型 2025年07月22日 0 点赞 0 评论 306 浏览
DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价 DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。 AI资讯 2025年09月30日 0 点赞 0 评论 239 浏览
国内AI大模型发展现状与未来趋势深度解读 在国内科技创新浪潮中,AI大模型已成为推动产业变革的核心引擎。据工信部2023年数据显示,我国10亿参数规模以上的大模型数量已突破100个,技术研发投入年增长率达67%,展现出从技术追赶到局部领跑的跨越式发展态势。本文将深度解析技术突破、行业应用、政策支持三维度的发展现状,并前瞻性预测未来三年的关键趋势。 知识库 2025年07月23日 0 点赞 0 评论 455 浏览
OpenAI Codex 深度解析Codex核心功能:云端智能体并行处理、AGENTS.md配置、192K长上下文代码分析。涵盖ChatGPT集成教程、Codex CLI本地部署、金融/自动驾驶应用案例及API定价策略。 AI 大模型 2025年06月30日 0 点赞 0 评论 918 浏览
大模型输入输出语义分析与评估 本文主要描述如何通过语义富化和搜索技术,帮助用户更好地理解大模型的输入输出,从而更有效地构建大模型应用。 技术开发 2025年03月25日 0 点赞 0 评论 253 浏览
百度文心X1价格战亮剑!API费用仅为DeepSeek-R1五分之一,逼宫国产模型市场 最近,百度文心大模型抛出了一枚"价格炸弹":其主力API调用费用直接降至市场同类产品的五分之一,特别是针对深度求索的DeepSeek-R1形成了直接的价格压制。这不仅仅是两家技术公司的商业竞争,更可能重塑整个国产大模型市场的游戏规则。 知识库 2025年08月21日 0 点赞 0 评论 167 浏览
从响应到查询:语言模型中逆向思维的力量 在一篇新论文《时间反转为 LLM 提供无监督反馈》中,来自 Google DeepMind 和印度科学研究所的研究团队提出了时间反转语言模型 (TRLM),这是一个允许 LLM 反向推理的框架——以与传统正向方法相反的方式评分和生成内容。 AI资讯 2025年07月04日 0 点赞 0 评论 185 浏览
Adobe Research 使用状态空间模型解锁视频世界模型中的长期记忆 通过将用于高效远程依赖建模的状态空间模型 (SSM) 与用于一致性的密集局部注意力相结合,并使用扩散强迫和框架局部注意力等训练策略,Adobe Research 的研究人员成功地克服了视频生成中长期记忆的长期挑战。 AI资讯 2025年06月19日 0 点赞 0 评论 223 浏览
大模型推理能力的边界 当前,大语言模型在各种任务中展现出了令人惊叹的能力,从写文章到写代码,从翻译到对话,似乎无所不能。但在实际业务应用中,很多企业发现这些“聪明”的模型在某些场景下会犯一些让人哭笑不得的错误,甚至给出完全不合逻辑的答案。 知识库 2025年10月06日 0 点赞 0 评论 110 浏览