AI 大模型的跨域训练是全球范围关注的前沿技术方向,它是指将多个不同的智算中心组合在一起训练同一个 AI 大模型。为什么需要跨域训练?业界通常的认知在于,当大模型未来发展到万亿、十万亿参数规模时,根据 Scaling Law 需要用到万卡甚至十万卡才能完成其预训练过程,这样的体量规模如果集中到一个集群内部,在技术、能源、配套等方面都存在着严峻的挑战,因此需要通过网络连接多个集群并加以组合,以共同训练同一个万亿/十万亿的大模型。
AI 液冷:预计 2025 年是渗透率加速的元年。随着生成式 AI 横空出世,传统的通算中心已无法满足日益增长的 AI 算力需求,智算中心(AIDC)成为算力设施发展的必然趋势,配套的散热需求也将随之增长,风冷技术已难以满足当前高功耗芯片及机组的散热需求。除英伟达外,谷歌、微软、Meta、华为、阿里等国内外云厂商均引入液冷技术方案。随着液冷技术从可选变为刚需,渗透率有望快速提升,预计2026 年全球数据中心液冷渗透率将提升至 30%左右。