DeepSeek 引领大模型创新浪潮。DeepSeek 的迅速推广和广泛应用将推动为行业树立了高质量数据驱动的标杆,进一步提升数据标准的精准性、多样性,加强算力和数据的协同优化,进一步加快 MoE 架构、强化学习训练方法和 FP8 等混合进度技术探索创新,有望助力国内大模型产业在稳步降低成本的同时实现模型性能跃升。我们认为,DeepSeek 在一定程度上重塑了大模型的技术发展范式,‚技术平权‛为产业升级注入了新活力,尤其是在金融、自动驾驶等领域表现尤为突出。此外,知识蒸馏已成为将大型模型的能力迁移至参数规模更小的模型的重要途径,蒸馏技术成为广泛部署 R1 能力中小型模型的有效策略,使大规模端侧部署更进一步,这为小模型赋能 AI PC、耳机、玩具和智能教育设备提供了有力支持。