DeepSeek使用教程蓝皮书-从入门到进阶完整指南

关于报告的所有内容,公众号『行业报告智库』阅读原文或点击菜单获取报告下载查看。

DeepSeek-R1 采用了独特的参数规模分层设计理念,构建了一套完备的推理能力体系。其最大版本的参数规模高达6710亿,这使得模型在处理复杂任务时表现出色。在数学推理领域,DeepSeek-R1 在 AIME 测试中达到了 79.8% 的准确率,具有强大的数学推理能力。在编程能力方面,它在 Codeforces 竞赛中超越了 96.3% 的人类选手,证明了其卓越的编程代码生成和逻辑推理能力。

与 OpenAI 的 O1 系列相比,DeepSeek-R1 在推理性能上毫不逊色,同时在成本上更具竞争力。在 MATH-500 测试中,DeepSeek-R1 达到了 97.3% 的准确率,与 OpenAI 的 O1 系列相当。但DeepSeek-R1 的 API 服务成本仅为竞品的三分之一,输入/输出 tokens 的单价分别为 1 元/百万 和 16 元/百万。成本优势在商业场景中非常重要。

DeepSeek-R1 采用了独有的双轨训练机制,结合长思维链微调技术和无监督强化学习技术。这种创新机制使模型能够在有限的标注数据下维持卓越的推理性能。在 SWE-bench 等工程类测试中,DeepSeek-R1 成功超越了 O1 系列,并且能够实现推理过程的自我反思与迭代优化,形成类似人类的问题解决思维链。

DeepSeek-R1 支持 4bit 量化压缩技术,减少了模型的存储空间和计算资源需求。动态模型切换技术使模型能够根据不同应用场景灵活切换版本,实现最佳性能表现。这种部署灵活性使 DeepSeek-R1 既能适配云端分布式系统,也能在本地设备实现高效响应。

DeepSeek-R1 通过免费开放部分版本的模型权重,降低了开发者的准入门槛,吸引了全球开发者参与应用开发。它提供标准化 API 和定制化训练框架,支持企业用户针对私有数据进行深度优化。这种开源与商业服务的协同创新,推动了 AI 推理服务行业的变革。

DeepSeek-R1 提供了网页版和 App 两种使用方式。用户可以通过访问官网或在应用商店搜索“DeepSeek”下载 官方App,随时随地使用这一强大的 AI 工具。

DeepSeek-R1 的聊天界面提供了两个关键开关:“深度思考”和“联网搜索”。开启“深度思考”功能后,模型将根据用户的问题进行深度推理,给出更精准的答案。而“联网搜索”功能则使模型能够参考最新的网络信息,确保回答的时效性和准确性。

DeepSeek-R1 的输入输出设计简洁高效。用户只需输入清晰明确的问题,模型便会输出精炼且切题的结果。这种设计减少了用户的操作难度,同时充分发挥了模型的深度推理能力。

在信息传递过程中,DeepSeek-R1 采用了动态平衡原则,涉及任务描述与结果要求两个维度的调节。用户可以通过隐式指令赋予模型探索空间,也可以通过显式指令提升输出的针对性。结果要求的设定可以是抽象的,也可以是具体的,用户可以根据需求灵活调整。

在使用 DeepSeek-R1 时,用户需要精准识别任务类型,并根据任务类型编写合适的提示词。例如,对于隐式任务,用户可以适当补充背景信息以引导模型的探索方向;对于显式任务,用户需要确保提示词的准确性和完整性。用户还可以通过使用量词和限定词、结构化指令、明确任务步骤等技巧,进一步提升模型的输出质量和交互效率。

在金融投资领域,DeepSeek-R1 可以通过隐式任务和抽象结果,为用户提供专业的风险评估报告。用户可以要求模型“评估股票的投资价值”,模型将生成一份详细的分析报告。用户还可以通过显式任务和具体结果,提取特定数据并结合工具生成可视化图表,如“提取近五年苹果公司股息支付率的季度数据,并制作 PDF”。

在教育辅导场景中,DeepSeek-R1 能够以简单易懂的方式解释复杂概念。用户可以要求模型“用厨房用具类比说明欧姆定律”,模型将生成包含多个生活案例的解释文本。用户还可以要求模型设计课程知识点或创建复习计划,如“设计三角函数入门课程的 5 个知识点”。

在医疗咨询领域,DeepSeek-R1 可以根据用户的体检报告提供专业的医学建议。用户可以要求模型“分析我的体检报告异常项”,模型将生成一份详细的医学建议报告。用户还可以要求模型列出特定疾病的饮食禁忌或制定健康管理方案,如“根据患者数据制定健康管理方案”。

在代码开发场景中,DeepSeek-R1 能够帮助用户开发应用程序或解决技术问题。例如,用户可以要求模型“开发一个 TODO 列表应用”,模型将生成一个包含基本功能的应用程序代码。用户还可以要求模型编写特定功能的代码并提供注释,如“编写 Python 函数计算斐波那契数列第 N 项”。

如果需要本地部署,用户可以根据自己的硬件配置选择合适的 DeepSeek 模型版本进行本地部署。对于内存低于 4GB 的设备,可以安装 DeepSeek-R1-1.5B 版本;而对于内存超过 32GB 的设备,则可以选择 DeepSeek-R1-32B 版本。本地部署需要安装 Ollama 工具,并通过命令行下载和运行 DeepSeek 模型。

对于硬件配置不足的用户,可以选择云端部署。用户可以通过安装 Cherry Studio 等客户端应用,并接入 SiliconCloud 或阿里云百炼等 API,快速体验 DeepSeek-R1 的功能。

DeepSeek-R1 已被广泛应用于消费电子领域,为用户提供智能化交互体验。一些手机厂商如OPPO Find N5 通过小布助手实现了精准的语音唤醒功能,而荣耀 MagicOS 8.0 则通过 YOYO 智能体商店为用户提供一站式的智能服务。DeepSeek-R1 的应用不仅提升了用户体验,还推动了消费电子行业的智能化发展。

在云计算领域,DeepSeek-R1 与十大云平台完成了深度技术对接,为云服务注入了强大的智能动力。移动云通过智算中心为 DeepSeek-R1 提供优化蒸馏服务,而京东云则通过言犀平台实现了模型的一键部署。这种合作推动了云服务向智能化、个性化方向发展。

金融行业对 DeepSeek-R1 的应用呈现出爆发式增长。一些证券等头部券商已完成 DeepSeek-R1 的本地化部署,将其应用于智能投研和风险建模。DeepSeek-R1 的数据分析和预测能力为金融机构提供了高效的研究工具和风险控制手段。

三大基础电信企业已全面接入 DeepSeek-R1 模型,提升了通信服务的智能化水平。DeepSeek-R1 在客服系统优化和网络智能运维方面的应用,显著提高了客户满意度和网络稳定性。

社交账号快速登录