2026 年,智算驱动的产业变革下,算力早已不是单纯的技术指标,而是支撑国家技术突破、产业竞争的核心基础要素。
算力的量级跃迁,是整个产业最直观的变化。从深度学习时代到生成式 AI 时代,再到当前的智能体与具身智能阶段,芯片算力从 TFLOPS 量级跃升至数十 PFLOPS,整机部署从单机八卡演进到千卡级超节点,计算集群从千卡规模拓展到数十万卡,对应的集群功耗也从千瓦级一路攀升到吉瓦级。
Scaling Law 的持续演进,让扩大算力规模成为提升模型性能的核心路径,直接推动算力基础设施持续扩张。数据显示,模型训练所需算力已从平缓增长转向指数级上升,前沿大模型的训练算力迈入 1E+26 FLOP 区间。不同 AI 环节的算力消耗差异显著,数据准备阶段仅需数十到数百卡算力,模型预训练需要万卡级算力支撑,超大规模模型的推理部署也需要千卡级算力打底。
全球范围内,政策与市场双重发力,共同拉动算力产业扩容。美国将先进计算与人工智能列为关键新兴技术优先方向,出台行动计划简化数据中心与半导体制造审批流程,强化 AI 计算出口管制。欧盟把构建 AI 计算基础设施作为核心支柱,通过 AI 工厂、超级计算机升级等措施提升战略自主性。中国持续完善全国一体化算力网,推动东数西算工程深化,实施超大规模智算集群、算电协同等新基建工程。科技巨头纷纷加码全球算力布局,头部云厂商在全球建成的数据中心从三十个到上百个不等,覆盖亚洲、欧洲、美洲等区域,形成全球化的算力供给网络。
AI 芯片是算力产业的核心战场,全球形成两条差异化发展路线。海外厂商主打单点算力峰值突破,头部企业的芯片架构保持稳定迭代节奏,每一代产品都在算力、显存、带宽、互联能力上实现大幅跃升。从三年前的旗舰芯片到最新一代产品,FP8 算力从近 4PFLOPS 提升到 17.5PFLOPS,单卡显存从 80GB 扩容到 288GB,显存带宽从 3.35TB/s 增长到 22TB/s,芯片间互联带宽从 900GB/s 升级到 3.6TB/s。
一些企业也推出自研训练与推理芯片,通过软硬件垂直整合提升云端算力性价比。国内厂商侧重集群化突破,依托体系化能力弥补单点算力差距。多家国内芯片企业推出训推一体产品,支持 FP8 全精度运算,适配主流大模型架构,集群关键指标逐步逼近国际主流水平。整个产业的异构算力架构,正在从 CPU 加 GPU 为主的模式,向 CPU 加 GPU 加 XPU 的多元路线演进,专用计算单元不断加入,适配更丰富的 AI 负载。
整机层面,超节点架构成为提升算力效能的核心方向。AI 工作站已经形成完整产品矩阵,从迷你型、移动型到塔式,从入门级、专业级到企业级,覆盖个人开发者到企业本地部署的全部需求。AI 服务器加速向集群化与高速互联架构升级,超节点服务器通过单节点内集成更多芯片,搭配高速互联技术,实现超高带宽与超低时延。
国内多款超节点方案落地,有的产品跨节点通信带宽提升 15 倍,通信时延下降 10 倍,千亿参数稠密模型训练性能达到传统集群的 2.5 倍以上。有的单机柜可实现数百颗芯片超高速互连,将万亿参数 MoE 模型的训练推理性能提升三成到四成。训练与推理的边界正在模糊,多数主流服务器都支持训推一体,能够灵活切换不同工作负载。
算力中心建设进入高强度投入期,呈现高 AI 占比、高功率密度、高电力消耗的特征。2026 年全球算力中心总容量达到 102GW,其中 AI 负载容量 62GW,占比超过六成。预计到 2030 年,全球总容量将增长到 220GW,AI 负载占比提升至七成以上。
美国算力中心年耗电量持续增长,占全美电力需求的比重逐步提升,AI 成为新增电力需求的核心拉动因素。中国算力中心总容量稳步扩张,AI 负载占比持续提升,成为新增算力中心的建设重点。
高功率密度推动散热技术迭代,液冷已经成为新建算力中心的主流方案。冷板式液冷 PUE 可降到 1.1 到 1.2 区间,单相浸没式方案 PUE 能够低于 1.05,有效适配高密度 GPU 集群的散热需求。电力供给结构也在变化,可再生能源占比持续提升,风光储一体化、水光互补等模式在多地落地,核能氢能作为中长期供电方案进入探索阶段,推动算力中心向低碳方向演进。
算力的应用边界不断拓宽,推理算力需求呈现爆发态势。AI 应用从交互智能向执行智能迈进,多智能体框架的出现催生新的推理算力需求。多模态数据持续增长,进一步拓展智能应用边界,激发更多潜在算力消耗。算力赋能的场景从科学智能、具身智能等前沿领域,向工业、交通、能源等传统行业全面渗透。云边端协同的算力供给体系逐步成型,云端算力中心负责大规模训练与复杂推理,边缘与终端设备承担本地实时计算,共同支撑各类场景的智能化需求。
关于报告的所有内容,公众号『行业报告智库』阅读原文或点击菜单获取报告下载查看。