关于报告的所有内容,公众号『行业报告智库』阅读原文或点击菜单获取报告下载查看。
DeepSeek的模型训练成本仅为560万美元,远低于Meta Llama 3 405B模型所需的3080万美元。这一成本下降主要是多头潜在注意力机制、FP8混合精度训练等技术创新。随着训练成本的降低,GenAI产品的创新速度和可用性将大幅提升,推动互联网和软件行业的投资回报率(ROIC)上升。
研究指出,美国科技巨头计划在2025至2026年投入约6500亿美元用于总资本支出,这将进一步加速GenAI产品的创新和普及。谷歌、Meta、亚马逊和微软等公司将成为这一趋势的主要受益者。
尽管DeepSeek的技术令人印象深刻,但研究认为这不会改变半导体行业的投资计划。GPU扩建计划仍将继续,因为DeepSeek的技术并未触及大型云服务提供商的核心投资领域。但DeepSeek的成功可能会促使半导体行业更加关注算法效率的提升,从而推动芯片设计的创新。
DeepSeek的成功也引发了地缘政治的担忧。美国和中国在大型语言模型领域的竞争日益激烈,DeepSeek的低成本模型可能会对美国LLM市场构成挑战。据报告预计,美国公司将继续投入资金和创新,但在中国LLM在美国的采用方面仍将面临障碍。
DeepSeek的R1模型展示了小型模型的蒸馏能力,这可能会推动开源模型的普及。开源模型的性能差距正在缩小,这给人工智能领域的大支出者带来了压力,迫使他们合理化训练运行,而不是以较低的价格利用他人的工作。
DeepSeek的架构和预训练带来的成本效率改进,对互联网和软件行业来说是一个积极的信号。谷歌、Meta和亚马逊等公司拥有庞大的资本支出和用户基础,能够从这些较低的成本中获益。更高效的架构还可以导致更广泛的GPU支持,推动小型企业的产品创新。
在软件领域,DeepSeek的算法效率提升正在降低GenAI的输入成本。微软、ServiceNow、Snowflake等公司已经积极推动降低这些投入成本,以提高利用率。微软的“PhT”小型语言模型战略就是一个典型例子,该公司通过降低成本效益模型而非最大化训练计算,来构建更智能的模型。
随着GenAI的普及,能源和网络基础设施的需求也在增长。研究显示,美国数据中心的电力需求在未来几年将大幅增加,其中75%以上的需求来自推理而非训练。这一趋势将推动对数据中心和网络技术的投资,Arista Networks等公司将成为主要受益者。
DeepSeek的成功也对硬件行业产生了深远影响。戴尔和希捷科技等公司可能会面临中长期的市场压力,因为DeepSeek的低成本模型减少了对高性能硬件的需求。但苹果公司可能会成为相对的人工智能投资回报率赢家,因为其专注于功能特定的小型设备上的人工智能语言模型,而非大型前沿模型。
DeepSeek在生成式人工智能领域的进步,也直接影响了具身化人工智能的发展。报告预计,随着数字空间的扩大,物理人工智能将获得越来越多的关注。从类人机器人到自动驾驶汽车,具身化人工智能的机会将越来越有吸引力。