豆包+DeepSeek 破局,国产大模型弯道超车。豆包和 DeepSeek 分别在多模态和轻量化两方面加速了国产大模型的发展进程。2024 年 12 月 18 日,豆包发布豆包视觉理解模型,一举成为国内最领先的多模态大模型之一;同为 12 月,DeepSeek 发布 DeepSeek-V3 大模型,拥有 671B 总参数、37B 激活参数,成本仅为 557.6 万美元,但在性能上却与 GPT-4o 和 Claude-3.5-Sonnet 同属世界顶尖水平。国内其他模型厂商也加速了追赶节奏,2025 年以来,豆包、通义千问、百度、腾讯混元、阶跃星辰和 Kimi 等其他国产大模型加速了更新迭代,例如通义千问在 3 月连续发布 QwQ-32B 与 Qwen2.5-Omni 等。豆包对多模态的探索,以及 DeepSeek 对轻量化大模型的升级节奏,有望开创大模型开源、低成本、高性能的新时代,为应用侧公司探索创新 AI 应用提供巨大便利,AI 应用加速放量下推理侧需求有望提升。