从响应到查询:语言模型中逆向思维的力量 在一篇新论文《时间反转为 LLM 提供无监督反馈》中,来自 Google DeepMind 和印度科学研究所的研究团队提出了时间反转语言模型 (TRLM),这是一个允许 LLM 反向推理的框架——以与传统正向方法相反的方式评分和生成内容。 AI资讯 2025年07月04日 0 点赞 0 评论 336 浏览
Adobe Research 使用状态空间模型解锁视频世界模型中的长期记忆 通过将用于高效远程依赖建模的状态空间模型 (SSM) 与用于一致性的密集局部注意力相结合,并使用扩散强迫和框架局部注意力等训练策略,Adobe Research 的研究人员成功地克服了视频生成中长期记忆的长期挑战。 AI资讯 2025年06月19日 0 点赞 0 评论 371 浏览
AI大模型技术解析:从原理到应用场景全指南 在人工智能技术快速发展的今天,AI大模型已成为推动产业变革的核心驱动力。本文将深入解析大模型的技术原理、训练方法及典型应用场景,帮助读者全面了解这一前沿技术领域。 知识库 2025年07月23日 0 点赞 0 评论 347 浏览
腾讯混元大模型 深度解析腾讯混元大模型核心技术:混元T1推理架构、Turbo S快思考引擎、文生3D开源方案。涵盖API调用教程、游戏/医疗/工业场景案例,附免费体验入口与部署资源。 AI 大模型 2025年06月27日 0 点赞 0 评论 5612 浏览
23招教你掌握大模型提示词技巧 推理成本直降80%的Deepseek-R1横空出世,OpenAI对GPT-4o进行了迭代更新,马斯克的xAI推出Grok 3模型并声称性能超越ChatGPT ......在这场技术地震中,最引人注目的当属完全开源的DeepSeek。 技术开发 2025年03月17日 0 点赞 0 评论 655 浏览
【万字长文】大模型训练推理和性能优化算法总结和实践 阿里云公共云 AI 汽车行业大模型技术团队,致力于通过专业的全栈 AI 技术推动 AI 的落地应用。 技术开发 2025年09月30日 0 点赞 0 评论 390 浏览
如何结合多模态RAG和异步调用实现大模型内容理解? 如何利用多模态大模型和工程优化手段提升物流理赔业务效率。核心方案包括:通过多模态RAG技术实现图片查重,结合异步调用方法优化货损识别功能。 技术开发 2025年03月28日 0 点赞 0 评论 453 浏览
大模型在医疗中的应用与风险 想象一下,一位医生每天需要阅读几十份病历、研究最新医学文献、同时还要为复杂病例寻找最佳治疗方案——这几乎是超人才能完成的任务。而现在,人工智能大模型正在尝试成为医生的"超级助手",但这条路上既有希望也有挑战。 知识库 2025年10月02日 0 点赞 0 评论 265 浏览
大模型训练秘籍:数据、算法与算力的黄金三角 在人工智能领域,大模型的训练效果取决于三个核心要素:高质量的数据、先进的算法和强大的算力。这三者构成了大模型训练的黄金三角,缺一不可。其中,数据的质量与规模尤为关键。优质数据能显著提升模型的理解和生成能力,而数据不足或质量低下则会导致模型表现不佳,甚至产生偏见和错误输出。 知识库 2025年07月23日 0 点赞 0 评论 285 浏览
盘古大模型 深度解析盘古大模型5.5架构:5+N+X分层模型、Triplet Transformer预测引擎、快慢思考机制。涵盖API调用、矿山/医药/能源场景案例,附开源模型部署指南。 AI 大模型 2025年06月30日 1 点赞 0 评论 1882 浏览