快手开源80亿参数多模态大模型Keye-VL-1.5,视频理解能力达SOTA。 在短视频内容爆炸式增长的今天,如何让机器真正"看懂"视频内容,一直是科技公司面临的巨大挑战。视频不仅仅是图像和声音的简单组合,还包含着场景、动作、情感和上下文等复杂信息。传统的AI模型往往只能处理单一类型的信息,难以全面理解视频的丰富内涵。 知识库 2025年09月09日 0 点赞 0 评论 8 浏览