算法是驱动是人工智能发展的核心引擎,决定了应用的智能上限,也牵引着算力的发展。2024年,o系列、Llama3、通义千问、R1等大模型不断升级,尤其是DeepSeek R1系列模型的发布,正是基于算法层面的极大创新,对中国乃至全球的人工智能产业带来深刻变革。一方面DeepSeek采用了大规模强化学习、多头注意力机制等算法创新,智能水平在美国高中数学竞赛邀请赛AIME、博士水平科学问答等测试中榜单上接近甚至超过了OpenAI的o1模型;另一方面,DeepSeek R1算法的创新也带来训练和推理阶段算力消耗的降低,训练算力只有Llama3的1/10,推理阶段缓存数据量降低了50倍,为在算力约束的条件下进行AI算法创新提供了一个全新思路,吸引了全球开发者,7天实现了活跃用户数破亿。