2025年度AI十大趋势报告

关于报告的所有内容,公众号『行业报告智库』阅读原文或点击菜单获取报告下载查看。

2025年,我们正站在 AI 发展的历史性转折点。从 ChatGPT 引爆全球热潮到科技巨头争相布局 AGI,从算力基础设施的军备竞赛到开源生态的繁荣崛起,AI 技术正以前所未有的速度重塑世界。

算力已成为国家与企业战略布局的核心,算力经济更是智能产业的第一大引擎。全球范围内,AI 算力需求呈爆发式增长,直接催生超大规模数据中心建设浪潮。这些数据中心不再是传统服务器托管地,而是演变为集成海量计算、存储和网络资源的 “算力工厂”。

超级项目密集落地,OpenAI 与微软合作的 Stargate 星际之门计划投资超 1000 亿美元,Google AI 枢纽投入 400 亿美元,Microsoft AI 超级园区耗资 73 亿美元,亚马逊新建云区域约 200 亿美元。主权云与清洁能源项目同步推进,德国打造欧洲领先算力中心,西班牙建设南欧算力枢纽,马来西亚、印尼等新兴市场成为增长级,沙特阿拉伯凭借能源优势布局中东云区域,肯尼亚依托地热资源建设东非数字中心。

资本投入持续加码,超大规模数据中心运营商 AI 资本开支已达约 2980 亿美元。云计算厂商资本开支结构深刻转变,从传统通用计算资源转向 AI 专用算力基础设施,云厂商与 AI 企业的合作也从资源租赁升级为深度绑定的战略伙伴关系。

我国已将算力基础设施纳入国家战略,推进全国一体化算力网络建设,通过 “东数西算” 工程实现东部算力需求与西部可再生能源、土地资源的高效匹配。同时布局 “太空超级计算机” 与 “天地一体化算网”,北航牵头的 “天算星座” 云边协同试验、之江实验室 2025 年启动的 “三体计算星座” 方案,目标 2027 年部署百星级、百 TOPS 级太空超算,“星溪 02-S21” 异构 AI 平台已完成在轨验证。

超节点与超级群建设成为重点,由数万块高端 GPU 或专用 AI 芯片组成的集群,成为大模型训练与运行的核心支撑。在 AI 商用渗透率未饱和、生活场景深度融合的需求下,算力正朝着电力、水网般的基础保障能力演进。

随着 AI 应用成为主流,芯片正从 “通用计算” 全面转向 “AI 原生”。GPU 凭借强大的并行计算能力,占据 AI 训练领域主导地位,但其稀缺性与高价格倒逼行业探索替代方案。CPU 角色同步转型,通过集成 AI 加速指令集,高效协助 GPU 处理 AI 任务。

芯片架构向 AI 适配全面倾斜,NPU 已成为智能手机、PC 和物联网设备的标配,实现端侧低功耗、低延迟 AI 推理。ASIC 与 FPGA 等定制化芯片迎来增长机遇,满足特定场景的算力需求。全球 AI 芯片市场格局生变,2025 年预测英伟达占比约 50%,AMD、华为、海光、寒武纪等厂商共同分割剩余市场,传统芯片大厂财报亮眼,替代方案需求旺盛。

国产替代进程成效显著,形成 “国产模型 + 国产芯片 + 国产 SDK” 的完整方案,并成功完成千亿级参数大模型训练验证,标志着我国已具备不依赖国外核心技术的超大规模 AI 模型研发能力。DeepSeek 等模型针对华为升腾芯片深度优化,国内企业积极开发自主并行计算 SDK,摆脱对国外专有平台的依赖。以华为、寒武纪为代表的企业全力攻坚高性能 AI 芯片,完善的软件生态成为发挥硬件性能、降低用户门槛的关键。

算力制约下,预训练水平决定大模型梯队划分,架构创新成为突破 “规模” 与 “效率” 矛盾的核心路径。业界仍信奉规模定律,但无限增大参数导致训练与推理成本激增,混合专家模型(MoE)成为主流选择,其 “大参数,小激活” 的核心思路,让模型在不显著增加计算成本的前提下,大幅扩展容量与知识储备。

国内顶尖模型普遍采用 MoE 架构,阿里 Qwen3 旗舰版总参数 2358 亿、激活参数 228 亿,支持 119 种语言与 256K 上下文;华为 Pangu Ultra MoE 总参数 718 亿、激活参数 39 亿,基于昇腾 NPU 训练;智谱 GLM-4.6 总参数 355 亿、激活参数 32 亿,编程表现突出;月之暗面 Kimi K2 总参数 1T、激活参数 32B,具备超强代码和 Agent 能力。这些模型均取得与密集模型相媲美的 SOTA 性能。

超越 Transformer 架构的探索持续深入,线性注意力将计算复杂度降低至 O (n),稀疏注意力仅计算部分关键 token 间的注意力,有效突破 Transformer 固有的 O (n²) 二次方计算复杂度瓶颈。百度 ERNIE 5.0 采用超稀疏 MoE 架构,实现文本、图像、音频、视频全模态统一建模;面壁智能 MiniCPM4 原生可训练稀疏注意力,稀疏度高达 95%,显著降低内存与计算消耗。

模型蒸馏与强化学习技术同步发展,通过 “教师模型” 向 “学生模型” 传递知识,实现模型轻量化部署,满足端侧低延迟、高隐私需求。RLHF(人类反馈强化学习)成为对话式 AI 训练标准流程,RLVR(可验证奖励强化学习)、RLMT(模型奖励思维强化学习)等新技术不断涌现,持续提升模型任务表现。

大模型落地进入 “推理时间”,推理需求成为技术创新的核心驱动力。2025 年模型推理能力提升聚焦三大方向:多模态深度推理实现跨模态复杂任务处理,如文本描述生成视频、图像逻辑推理问答;自适应推理根据任务复杂度动态调整计算资源,简单问题快速响应,复杂问题深度思考;异构计算协同通过不同计算单元组合,实现整体性能最优化。

推理时间延长成为新趋势,模型从追求即时响应转向允许更长思考过程。硬件加速持续升级,GPU、FPGA、ASIC 等专用 AI 芯片广泛应用于特定推理任务,边缘计算与推理加速技术突破,专用边缘 AI 芯片与优化推理框架降低延迟、提升响应速度。增量学习让模型从环境交互中持续优化,而非局限于固定训练数据。

推理框架不断进化,MoE 架构大幅增加专家数量但每次推理仅激活少量参数;OCR 技术用极少 “视觉 token” 表征大量文本信息;隐式推理让模型在内部进行 “思考”,多路径推理丰富问题解决方式。随着 Agent 发展与多模态融合,推理系统正通过架构与任务定义革新,改变问题解决的根本方式。

AI 发展呈现 “信息 AI 应用期,物理 AI 研发期” 的双轨并行格局,具身智能成为二者合流的核心风口。物理 AI 强调对物理世界的深刻理解与交互能力,要求智能体掌握重力、摩擦力、物体恒存性等物理规律,在真实动态环境中完成感知、决策与行动。英伟达、阿里、谷歌、亚马逊等巨头全面投入机器人与物理 AI 领域。

世界模型作为物理 AI 的核心,正融合几何、力学、因果关系等物理概念,通过视频生成模型预测物体未来状态,借助物理引擎增强物理常识。具身智能实体化进程加速,人形机器人从实验室走向商业应用,工业场景已获得小规模商业订单,执行重复性、危险性、高精度任务,家庭场景原型产品持续涌现。

具身智能发展从 “身体” 构建转向 “大脑” 突破,VLA(视觉 – 语言 – 动作统一框架)与世界模型规划成为两大技术路线。开源生态推动技术普及,Physical Intelligence 团队的兀系列 & OpenPI 采用流匹配技术,动作生成平滑度与多任务泛化能力优于传统扩散模型;OpenVLA 基于 Llama 2 构建,微调便捷且生态成熟;宇树科技 Unitree RL Gym 开源强化学习训练代码,成为人形机器人行走训练的重要参考。

高质量数据集建设至关重要,远程遥控操作、动捕设备、仿真环境生成等多种采集方式保障训练效果。产学研协同加速发展,开源探索持续推进,IPO 与投融资活动频繁,具身智能成为 AI 落地的核心赛道之一。

AI Agent 成为继大型语言模型后的下一个技术范式,2025 年各类行业场景 Agent 应用密集涌现。成熟 AI Agent 具备感知、规划、决策、执行的完整闭环能力,通过多模态感知理解环境与任务,制定动态行动计划,依据反馈实时调整策略,胜任传统 AI 难以完成的复杂任务。

开发门槛大幅降低,AI Coding 技术爆发式增长,开发者可快速生成 Agent 所需代码,将精力集中于逻辑设计与功能创新。主流 Agent 框架各有侧重:LangGraph 支持有状态工作流,复杂流程控制稳定性高;AutoGen 对话驱动,代码生成能力突出;Agents SDK 专为多智能体协作设计,轻量级且调试直观;Dify 提供企业级低代码可视化界面;Coze 零代码拖拽操作,插件丰富。

流量入口迎来根本性变革,从 “人找服务” 转向 “服务找人” 的全新范式。用户通过自然语言对话即可下达指令,Agent 自主调用各类应用与服务完成复杂任务,对话成为核心入口。传统 App 与网站正被专业化 Agent 替代,操作系统有望进化为超级 Agent,成为用户与数字世界交互的唯一入口。大型技术企业加速 Agent 模式战略转型,初创企业通过业务理解深化找到高级创业空间。

多模态技术成为 AI 应用落地的核心支撑,视频、3D、代码三大领域依次展现生产力变革,AI 正逐步成为相关产业的标准工具。视频生成沿着两条主线推进:通用视频大模型如 Sora2、Gen-4.5、Pika2.2,追求文本描述生成高质量、长时程、逻辑连贯的视频,持续提升分辨率、物理真实性与内容可控性;行业垂直优化聚焦影视制作与广告行业,可灵 2.6、Vidu Q2 等工具快速生成预览、特效、动画,大幅提升创作效率、降低制作成本。

3D 生成技术重塑传统工作流程,将碎片化的 3D 建模环节统一化,实现从文本或图像输入到 3D 模型,场景的一次性生成,覆盖粗模创建、细节雕塑、绑定链接、动画制作全流程。游戏、影视、元宇宙、工业设计等领域的巨大需求,推动 3D 生成技术快速迭代,让 3D 内容创作更趋大众化与高效化。

代码生成跨越生产力门槛,成为开发者必备工具。Vibe Coding(氛围编程)成为流行趋势,开发者通过自然语言描述编程意图,AI 即可生成代码甚至搭建完整项目,非专业人士也能参与软件开发。多模态能力持续升级,AI 可基于 UI 设计图、产品需求文档等多种输入生成代码,实现文本、音频、视觉融合的开发环境。AI 代码生成不仅实现 “降本增效”,更推动 “价值创造” 与 “能力升维”,成为产业生存必需品。

AI 加速硬件设备智能化浪潮,PC、手机、汽车、眼镜、玩具等各类终端全面 “焕脑”。AI PC 迎来规模化拐点,英特尔、AMD、高通、苹果等主流芯片厂商均发布内置专用 NPU 的新一代处理器,PC 制造商密集推出相关产品,实现 AI 应用本地高效运行,无需依赖云端算力,推动个人计算领域重大变革。

可穿戴 AI 设备形态持续创新,智能眼镜实现实时翻译、物体识别,智能耳机提供会议记录与摘要,这些设备将 AI 无缝融入日常生活,成为人类 “第二大脑”。智能手机等移动设备深度集成 AI 功能,苹果、谷歌、三星等厂商将 AI 能力嵌入操作系统,实现智能照片分类、语音助手、实时翻译、文本摘要等功能,端侧 AI 成为高端手机核心卖点,正加速向中低端机型普及。

AI 玩具等新硬件形态涌现,传统玩具升级为能进行自然语言对话、讲故事、解答问题、个性化教育的智能伙伴。端侧智能优势凸显,本地处理实现低延迟响应,数据不上云保障高隐私安全,基于本地用户习惯的个性化服务更贴合需求。硬件升级与生态协同双轮驱动,新处理器集成更强 NPU 提供算力保障,软硬件深度协同构建完整端侧 AI 生态,推动应用创新持续爆发。

AI4S(AI for Science)成为加速 AGI 实现的关键力量,AI 在数学、物理、化学、生物等基础学科的能力已触及博士水平,全面重塑科学研究全流程。AI 医疗健康领域成效显著,阿里达摩院 GRAPE 模型通过非增强 CT 扫描识别早期胃癌,敏感性达 85.1%,在临床试验中将检出率提升 24.5%,其中 40% 为无症状患者;腾讯 DeepGEM 病理大模型对肺癌常见驱动基因突变预测精准度达 78%-99%,生成基因突变空间分布图,助力肿瘤异质性研究。

材料科学、化学、生物学领域应用全面开花。MIT CRESt 平台通过分析海量数据预测新材料性质;中国科学技术大学 ChemAgents AI 化学家 90 天内完成 3500 次测试,发现性能提升 9.3 倍的八元高墙合金催化剂;北京大学潘锋团队利用拓扑数据分析提取材料结构特征,将预测误差降低 55%;上海 AI 实验室丰登・基因科学家系统在水稻、玉米中自主发现数十个未知基因功能并获田间验证。

“Agentic Science” 理念兴起,从将 AI 视为 “智能助手” 转向构建自主执行完整科研闭环的 “AI 科学家”。这类系统具备感知与理解多模态科学数据、推理规划科学假设与验证步骤、调用工具执行任务、学习记忆迭代优化、协作沟通人类科学家或其他 AI 代理的综合能力,为实验科学、理论科学、计算科学、数据密集型科学带来全新发展范式。

AGI 已上升至我国国家战略核心,目标推动 AI 技术在社会经济体系中广泛扩散应用,构建开放、协作、自主可控的生态系统。中国 AI 企业实现从应用导向到核心技术自研的深刻转型,华为、阿里、腾讯、百度等科技巨头巨资研发 AI 芯片与大模型,DeepSeek 等初创公司明确以 AGI 为发展目标,获得国家科研与基础设施机构支持,通过开源模式加速技术迭代与市场渗透。

我国开源生态从参与者成长为领导者,顶尖科研机构与企业引领全球开源模型发布。DeepSeek 发布后用户超 1 亿,展现强大技术吸引力与社区活力;Qwen 凭借优异性能与开放协议,成为全球企业和研究机构模型微调与应用开发的首选基座之一。

国产开源模型下载量表现亮眼,BAAI 相关模型总下载量 7.90 亿次,Alibaba 相关模型 7.49 亿次,智谱 GLM-4.6 下载量 1.31 千万次,Qwen2.5-1.5B-Instruct 达 1.13 亿次,DeepSeek 系列多个模型下载量超百万,其中 DeepSeek-R1-Distill-Qwen-528 达 18 千万次。截至 2025 年,我国总算力规模预计超过 300 EFLOPS,智能算力占比达 35%,为开源生态与 AGI 发展提供坚实算力支撑。

社交账号快速登录