关于报告的所有内容,公众号『行业报告智库』阅读原文或点击菜单获取报告下载查看。
DeepSeek的出现,让算力需求发生了巨大的变化。过去,算力主要集中在训练侧,也就是训练大模型。但随着DeepSeek的开源,训练成本大幅降低,推理侧的算力需求开始爆发式增长。
开源模型让更多的企业和开发者能够低成本地开发AI应用。这些应用需要大量的推理算力来运行,这就推动了推理侧算力的快速增长。数据显示,2024年,中国智能算力市场规模持续增长,推理算力的占比从2022年的42%增长到2027年的72%。
DeepSeek通过知识蒸馏技术,把大模型压缩成轻量化版本,让这些模型能够在手机、电脑等端侧设备上高效运行。这就催生了端侧算力的崛起。2025年,工业质检、自动驾驶等场景将对边缘AI服务器的需求大增,市场规模预计突破200亿元。
DeepSeek的出现,还为国产芯片带来了巨大的机会。过去,AI芯片市场基本被英伟达等国外巨头垄断。但DeepSeek通过PTX优化等技术,降低了对高端GPU的依赖,让国产芯片有了更多的发展空间。截至2025年2月,DeepSeek已经和18家国产AI芯片企业完成适配,包括华为昇腾、沐曦、天数智芯等。
DeepSeek的出现,还让算力产业从“算力堆砌”转向了“算效优化”。过去,大家觉得算力就是硬件堆砌,越多越好。但DeepSeek用实际行动证明,通过算法创新和硬件优化,可以用更少的算力实现更高的性能。
DeepSeek采用FP8混合精度训练,训练时间减少了40%,预训练成本降至仅278.8万H800 GPU小时。这种“四两拨千斤”的技术路径,直接推翻了过去“暴力美学”的逻辑,让整个产业进入了算法创新的新阶段。
DeepSeek的火爆,让科技巨头们坐不住了。阿里、百度、腾讯、华为等大厂纷纷“拥抱”DeepSeek。大厂们的动作,不仅是对DeepSeek的认可,更是对整个AI产业趋势的响应。
DeepSeek的出现,也让AI创业公司们从“参数竞赛”回归到理性期。过去,大家拼的是模型参数大小,现在,大家更注重模型的实际应用和性能优化。这种理性回归,让AI创业公司们找到了更适合自己的发展路径。
DeepSeek的出现,还让智算中心出现了分化。A类智算中心(用于训练超大模型)建设速度不减,因为头部企业还在追求更高性能的AGI目标;B类智算中心(用于后训练)出现结构性过剩,建设减缓;C类智算中心(用于推理)则爆发式增长,因为推理算力需求大幅增加。
DeepSeek的开源,就像安卓系统的出现,直接催生了大量的AI应用。比如,GitHub和Hugging Face社区上的开发者实测,经过R1微调的80亿参数小模型可以在个人笔记本中运行。这意味着什么?简单来说,就是AI应用的开发门槛大幅降低,开发者们可以更容易地开发出各种AI应用。
DeepSeek推动了端侧AI的发展。未来的AI应用不仅可以在云端运行,还可以在手机、电脑等端侧设备上高效运行。
DeepSeek还催生了AI Agent的兴起。AI Agent是一种智能化的代理工具,可以帮助用户完成各种任务。比如,你可以让AI Agent帮你写邮件、整理日程,甚至帮你购物。这种智能化的工具,未来将成为我们生活和工作的一部分。
DeepSeek的开源模式,不仅改变了中国算力产业,还引发了全球效应。DeepSeek的开源模型在全球范围内被广泛使用,开发者们可以根据自己的需求进行优化和创新。这种开源模式,打破了过去OpenAI等闭源模型的垄断,让全球的AI开发者都能站在同一起跑线上。