大模型推理能力的边界 当前,大语言模型在各种任务中展现出了令人惊叹的能力,从写文章到写代码,从翻译到对话,似乎无所不能。但在实际业务应用中,很多企业发现这些“聪明”的模型在某些场景下会犯一些让人哭笑不得的错误,甚至给出完全不合逻辑的答案。 知识库 2025年10月06日 0 点赞 0 评论 108 浏览
大模型是如何记忆和遗忘的? 当企业投入大量资源训练大模型后,常常面临这样的困境:想让模型记住的重要业务知识总是记不牢,而需要遗忘的敏感数据却像"数字幽灵"般挥之不去。这种记忆与遗忘的失衡,直接影响着模型的实际应用效果和数据安全合规。 知识库 2025年10月02日 0 点赞 0 评论 97 浏览
大模型在医疗中的应用与风险 想象一下,一位医生每天需要阅读几十份病历、研究最新医学文献、同时还要为复杂病例寻找最佳治疗方案——这几乎是超人才能完成的任务。而现在,人工智能大模型正在尝试成为医生的"超级助手",但这条路上既有希望也有挑战。 知识库 2025年10月02日 0 点赞 0 评论 98 浏览
DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价 DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。 AI资讯 2025年09月30日 0 点赞 0 评论 237 浏览
大模型是如何“学会”语言的? 当ChatGPT能流畅对话,当文心一言能创作诗歌,我们不禁好奇:这些大模型究竟是怎么掌握人类语言的?它们没有嘴巴、没有耳朵,却能理解我们的问题并给出合理回答。今天,我们就用大白话,揭开大模型学习语言的神秘面纱。 知识库 2025年09月30日 0 点赞 0 评论 220 浏览
【万字长文】大模型训练推理和性能优化算法总结和实践 阿里云公共云 AI 汽车行业大模型技术团队,致力于通过专业的全栈 AI 技术推动 AI 的落地应用。 技术开发 2025年09月30日 0 点赞 0 评论 246 浏览
大模型是什么?一文看懂AI核心技术 最近很多企业在数字化转型中遇到这样的困扰:客服系统响应机械,内容创作效率低下,数据分析依赖人工...这些问题的背后,其实都指向同一个技术核心——大模型。今天我们就用最直白的语言,揭开这项AI技术的神秘面纱。 知识库 2025年09月29日 0 点赞 0 评论 107 浏览
爱诗科技发布新一代视频生成大模型PixVerse V5及Agent创作助手,全球用户破亿 PixVerseV5是爱诗科技推出的新一代视频生成模型。与之前的版本相比,它在画面质量、动作流畅度和细节表现上都有了显著提升。简单来说,它能够根据用户输入的文本或图片,快速生成一段高质量、高清晰度的视频,并且视频中的物体运动更加自然,光影效果也更接近真实。 知识库 2025年09月03日 0 点赞 0 评论 112 浏览
百度文心X1价格战亮剑!API费用仅为DeepSeek-R1五分之一,逼宫国产模型市场 最近,百度文心大模型抛出了一枚"价格炸弹":其主力API调用费用直接降至市场同类产品的五分之一,特别是针对深度求索的DeepSeek-R1形成了直接的价格压制。这不仅仅是两家技术公司的商业竞争,更可能重塑整个国产大模型市场的游戏规则。 知识库 2025年08月21日 0 点赞 0 评论 167 浏览
探索大模型时代:AI如何重塑未来科技与产业 在人工智能技术飞速发展的今天,大模型正成为推动科技与产业变革的核心力量。从自然语言处理到计算机视觉,从医疗诊断到金融预测,大模型的应用场景不断拓展,展现出前所未有的潜力。其中,多模态大模型的发展尤为关键。多模态大模型能同时处理文本、图像、音频等多种数据类型,通过跨模态学习实现更复杂的任务,为产业智能化升级提供全新解决方案。 知识库 2025年08月11日 0 点赞 0 评论 141 浏览