2025年DeepSeek手册：DeepSeek给我们带来的创业机会

语言	格式	评分
中文（简体）	.pdf	3
概览
政企、创业者必读国内DeepSeek最前沿资料政企、创业者必读《DeepSeek给我们带来的创业机会》 360集团创始人周鸿祎 3 政企、创业者必读政企、创业者必读一张图读懂一堂DeepSeek课政企、创业者必读 AI给了一个比互联网更大的机会  互联网是连接平台，人工智能是生产力  互联网是赋能性技术，生产力属性较弱  人工智能既能单兵作战，也能外部赋能互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5 政企、创业者必读大模型是真智能，是人工智能的重大拐点。你相不相信？大模型是一场工业革命，将重塑所有产品和业务。你相不相信？不拥抱AI的组织和个人，会被拥抱AI的组织和个人淘汰。你相不相信？建立AI信仰 6 政企、创业者必读大模型不是泡沫，而是新一轮工业革命的驱动引擎蒸汽革命电气革命信息革命以大模型为代表的人工智能革命人工智能是新质生产力的关键支撑技术，人工智能+百业千行将带动新一轮工业革命，为高质量发展注入强大动能大模型的进一步突破将引领人类社会进入智能化时代，对我们的生活方式、生产方式带来巨大变革重塑经济图景解决复杂问题 7 政企、创业者必读 8 AI不仅是技术革新，更是思维方式和社会结构的变革国家产业个人企业政企、创业者必读人工智能发展历程（一）  从早期基于规则的专家系统，走向基于学习训练的感知型AI  从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI  从擅长理解的认知型AI，发展到擅长文字生成的生成式AI  从语言生成式AI，发展到可理解和生成声音、图片、视频的多模态AI  从生成式AI，发展到推理型AI 专家系统感知AI 认知AI 生成式AI 多模态AI 推理式AI 9 政企、创业者必读人工智能发展历程（二）  从单纯对话的大模型AI，发展到具有行动和执行能力的智能体AI  从数字空间中的AI，走向能理解和操控物理空间的AI  从解决现实问题的AI，走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10 政企、创业者必读面对全球大模型产业之争，要打赢「三大战役」 AGI之战应用场景之战大模型安全之战 • 探索超越人类的超级人工智能AGI • 不仅是科技之争，更是国运之争 • 不发展是最大的不安全，发挥举国体制优势，打赢追赶之战 • 大模型带来前所未有安全挑战 • 外挂式传统安全手段难以应对 • 应对模型安全新挑战，打赢未雨绸缪之战 • 大模型是能力而非产品，结合场景才能发挥价值 • 中国拥有最完整的产业链、最全的工业门类、最丰富的场景 • 发挥场景优势，加速传统产业数转智改，打赢弯道超车之战 AGI是全球少数玩家的游戏，政府、企业、创业者更多创新的机会在应用之路 11 政企、创业者必读把大模型拉下神坛！走入千家万户、百行千业，才能掀起新工业革命 • 当年IBM做出超级电脑，并没有带来工业革命，因为只有少数人用 • IBM甚至声称，全世界只用5台电脑就够了 • 真正带来信息革命的是个人电脑走入千家万户、百行千业当年的电脑当今的大模型 • 如果需要十万或百万张卡起玩，就无法产生工业革命 • 只有把大模型拉下神坛，让大模型走进千家万户、百行千业，才能掀起新一轮工业革命 12 政企、创业者必读 DeepSeek出现之前我们对大模型发展趋势的十大预判 13 政企、创业者必读 14 DeepSeek出现之前的十大预判之一传统AGI发展步伐在放慢需要寻找新方向  Scaling Law边际效应递减  人类训练数据接近枯竭  合成数据无法创造新知识  推理能力难以泛化，成本高昂全面超越人类的人工智能在逻辑上不成立政企、创业者必读 15 DeepSeek出现之前的十大预判之二慢思考成为新的发展模式  大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」  大模型厂商都在探索慢思考、思维链技术政企、创业者必读 DeepSeek出现之前的十大预判之三模型越做越专  除了少数科技巨头，大多数公司都专注于做专业大模型  MoE架构盛行，本质是多个专家模型组成一个大模型  Deepmind的Alpha系列产品是这一趋势的最佳诠释 16 政企、创业者必读 DeepSeek出现之前的十大预判之四模型越做越小 17  大模型进入「轻量化」时代，上车上终端，蒸馏小模型  先做得更大，然后探索能做多小政企、创业者必读 DeepSeek出现之前的十大预判之五知识的质量和密度决定大模型能力  高质量数据、合成数据使模型知识密度的快速增长  大模型能以更少的参数量达到更高的性能  360联合北大研发：5%参数量逼近Deepseek-R1满血性能 18 政企、创业者必读 DeepSeek出现之前的十大预判之六成本越来越低  过去一年，大模型成本「自由落体」  国外：GPT-4等效智能在过去18个月内价格下降240倍  国内：大模型「亏本」卖，可以「白嫖」大模型API能力 19 政企、创业者必读 DeepSeek出现之前的十大预判之七多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时，规模正在变小 20 政企、创业者必读 21 DeepSeek出现之前的十大预判之八智能体推动大模型快速落地  能够调用各种工具，具有行动能力  调用企业专业知识，更懂企业  将日常重复性业务流程形成Playbook，实现流程自动化  通过目标拆解，多次调用大模型以及专家模型协同，形成慢思考能力传统软件是辅助人的工具，Agent是能够自主工作的数字员工，是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判之九开源效果追赶上闭源  技术开放，吸引广大开发人员和用户使用  很多公司参与开源，帮助改进产品，众人拾柴火焰高，反哺开源产品，形成正循环政企、创业者必读 DeepSeek出现之前的十大预判之十中美差距快速缩小  美国预训练堆算力的路线不可持续，有待发现新范式“换道超车”  软件和算法差距并不大，主要差距在工程、硬件等方面 23 政企、创业者必读 DeepSeek的出现验证了我们的预判而DeepSeek的创新更具颠覆性 24 政企、创业者必读 DeepSeek是完美的颠覆式创新  技术创新——让过去做不到的事情可以做到  体验创新——让使用起来很难很复杂的东西变得很简单易用  市场推广创新——让过去很难得到的东西可以得到  商业模式创新——让过去很昂贵的东西变得很便宜甚至免费 DeepSeek正是符合这四种创新模式的完美例子 25 颠覆式创新的四种方式政企、创业者必读 DeepSeek-R1突破了大模型Scaling Law瓶颈导致大模型悲观论认为大模型的能力无法进一步得到质的提升开辟强化学习新范式从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后，继续增大参数规模难以带来质的提升 • 训练算力成本和工程化难度大幅上升强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习，在不增大参数规模前提下，大幅提升复杂推理能力 • 通过后训练算力和推理算力，在不增加预训练算力前提下，大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26 政企、创业者必读  预训练模型如GPT——疯狂读书，积累知识，Scaling law撞墙  预训练模型思考深度不够  算力见顶，变成少数巨头游戏预训练大模型推理大模型预训练大模型难以通往AGI之路  推理模型如R1——通过逻辑链条推导答案，分解规划，自我反思  预训练范式像是记忆和模仿，强化学习范式更像探索实践  记住很多东西只是基础，真正有价值的是融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种政企、创业者必读快思考慢思考快慢人类真正智力表现的形式直觉经验型速度快、准确性低 GPT、DeepSeek-V3擅长的思考方式推理能力获得突破的关键是学会了「慢思考」例：课堂提问快问快答  长思维链强大的推理能力是真正人类智力的体现  预训练大模型是人记忆和学习的能力，推理模型是对复杂问题进行规划、分解、预测的能力，实现了真正的慢思考 28 例：课后作业仔细思考政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律，加速了AGI发展 Alpha Zero时刻 • Alpha Go采用监督学习，使用人类棋谱训练 • Alpha Zero采用强化学习，自己跟自己对弈 ChatGPT时刻 • OpenAI ChatGPT大模型，通过预训练方式，实现涌现，理解人类语言和知识 • 诞生预训练Scaling Law Deepseek-R1时刻 • o1采用强化学习，但训练复杂推理能力，技术未公开 • DeepSeek-R1 探索出RL方法，且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29 政企、创业者必读技术上实现对美国的赶超掌握通向AI下一阶段的方法论 DeepSeek颠覆式创新——技术创新  美国人仍在遵循预训练Scaling law范式，走堆显卡路线，如 “星际之门”计划  中国DeepSeek-R1的创新突破，诞生推理型Scaling Law，改写AI发展方向 30 政企、创业者必读 DeepSeek在用户体验上实现了三件事  更加理解用户需求，降低Prompt要求  直接呈现思维过程，展现像真人一样思考的能力  可实时联网，把搜索能力与推理能力结合 DeepSeek颠覆式创新——用户体验具备强大推理能力，思维过程更加缜密，智能性提升用起来更像真人，写作能力更强，想象力更丰富 31 政企、创业者必读 DeepSeek-R1用户体验改善的作用  R1在零广告投入下7天增长1亿用户，创最快应用破亿里程碑  把人工智能从不可用、凑合用，变成大家都能用、都爱用  推动市场加速发展，在中国用户、企业和政府彻底普及了一次AI  中国可能成为全球AI普及率、渗透率最高的国家，加速了中国爆发AI产业革命的步伐 DeepSeek颠覆式创新——用户体验 32 ——掀起新一轮AI科普教育认知决定行动，这场全民AI科普对推动中国AI发展功不可没政企、创业者必读开源改变行业格局，建立强大生态  开源战胜闭源，促使全球公司、开发者等转到开源  建立强大生态，成为全球人工智能根技术，无推广情况下各国政府、企业、云厂商纷纷接入，获得全球最大影响力  改变中美竞争格局：美国是闭源封闭垄断思路，中国领导开源文化，加速中国领先地位  中国人民使用的AI工具先进性已超过美国，普及率超过美国，使用AI人口超过美国总人口，且直接用上最先进的DeepSeek-R1 DeepSeek颠覆式创新——开源 33 政企、创业者必读新时代下的集中力量办大事  每个企业都可以直接使用DeepSeek，因为开源透明可信任，企业和政府可做大量私有化部署  一个开源产品获得突破之后，全世界都能分享成果，结束中国百模大战，节省大量成本  很多公司参与开源，帮助改进产品，很多人基于DS生态开发应用产品，增加影响力，人人为我，我为人人  技术开放，对人工智能行业形成蓬勃发展，寒武纪大爆炸，推动AGI 行业发展 DeepSeek颠覆式创新——开源 34 政企、创业者必读成本的急剧降低  DeepSeek可适配国产硬件，促进国产硬件发展  DeepSeek的优化降低对推理硬件的要求，减少推理成本  训练成本降低，堆显卡模式受质疑，探索新思路，算法优化空间大  无需训练自己的基座模型，直接部署在DeepSeek上，不用重复发明轮子  公开蒸馏方法，帮助其他模型提升能力，实现了模型制造模型，犹如工业母机  小模型可部署在企业内电脑或一体机上，使用成本降低，形成分布式推理网络  技术门槛降低，可标准化、SaaS化部署，下载就能用 DeepSeek颠覆式创新——成本暴跌 35 政企、创业者必读惠及全球人民，科技平权，技术平民化  运营商、云服务可免费用，降低云服务成本  大型企业可使用多个DeepSeek，解决不同场景需求  中小企业免费部署，消除数字鸿沟  个人可以拥有自己的DeepSeek ，可以成为超级个体  对于创业者得到世界最先进大模型，如虎添翼，和巨头站在同一起跑线上  很多发展中国家都能成为大模型玩家，实现人类命运共同体 DeepSeek颠覆式创新——免费 36 政企、创业者必读 DeepSeek引爆应用奇点东西又好又免费，每个人都能拥有 DeepSeek颠覆式创新——结论  企业中各场景都可用DeepSeek改进，降本增效，企业应用爆发  所有产品都值得被DeepSeek重构，产品应用爆发  创业公司得到DeepSeek加持，创业者拥有便宜领先的大模型，迎来机遇，带来“iPhone时刻” 中国变成AI渗透率最高的国家，率先实现AI工业革命 37 政企、创业者必读人人智能万物智能数转智改未来产业科学研究安全应用爆发的六大方向 38 政企、创业者必读 DeepSeek的开源和低成本使得个人也能够拥有自有大模型，实现超能力，成长为超级个体 DeepSeek六大应用方向之一人人智能：人人都要用AI 39 政企、创业者必读真正的机会是利用AI把所有的硬件重做一遍 DeepSeek六大应用方向之二万物智能：所有智能硬件都用AI重做 40 政企、创业者必读 DeepSeek六大应用方向之三数转智改：助力传统产业打造新质生产力用大模型帮助传统产业、制造业实现“数转智改”，利用AI降本增效 41 政企、创业者必读 DeepSeek六大应用方向之四未来产业：变不可能为可能 42  DeepSeek的技术为机器人、智能网联车、无人机、机器狗等带来巨大改进，降低成本和算力要求  低成本低算力需求使得模型更容易被部署到机器人等智能设备上，解决物理现实世界的认知、决策和行动问题政企、创业者必读赋予自动驾驶复杂物理世界理解能力从规则驱动到学习驱动 43 政企、创业者必读  人工智能的目标是星辰大海，是为了让人类在科技上有突破  基于DeepSeek的强推理模型，利用科学领域专业知识进行强化学习，能够打造更加专业的科学推理模型 DeepSeek六大应用方向之五科学研究：打造科研新范式 44 政企、创业者必读 AI For Science，为基础科学带来革命性变化 2024诺贝尔化学奖颁发给研发AlphaFold的两位AI专家未来所有科学研究都将以AI为中心过去如何做蛋白质研究 AlphaFold 1. X射线晶体衍射 2. 核磁共振 3. 冷冻电子显微镜 1. 利用Transformer的预测能力， 2. 直接从蛋白质的氨基酸序列 3. 中预测蛋白质的3D结构靠肉眼观察，几年才能发现一个复杂蛋白质结构，半个世纪预测了20多万种从数年缩短到几分钟，解开了生物学密码成功预测了地球存在的2亿种蛋白质结构 45 政企、创业者必读  DeepSeek典型的四大安全问题：客户端安全、Agent安全、知识安全、模型安全  360提出「以模制模」新解法，应对DeepSeek安全问题 DeepSeek六大应用方向之六 AI安全：实现安全的「自动驾驶」 46 政企、创业者必读大模型的六大能力 47 基本能力业务能力创新能力赋能未来产业创意能力赋能企业数转智改数学计算语义理解逻辑推理语言翻译文本创作自动驾驶具身智能 1 2 4 5 知识问答代码编程文本生成多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究脑机接口基础科学能源自由宇宙探索生命科学科学能力 6 AI Fo r Science 知识管理（内部知识管理、外部情报分析、大数据分析、工作流知识）专家经验模型（专业模型训练）业务流程自动化（ A g e n t框架）组织协同（工作流）人机交互赋能个人和企业员工生产力提升多模态能力 3 图片理解和处理视频理解和处理音频理解和处理非结构化文档处理 47 政企、创业者必读 DeepSeek能力很强大个人使用绰绰有余但要在政府、企业应用需要和场景结合  大模型要藏在产品后面  客户要的不是电动机，是「刮胡刀」「吹风机」  没有人会买一个电动机后，说「来，给爷表演一下27000转」 48 政企、创业者必读如何解决 DeepSeek在政府、企业的应用问题？ 49 政企、创业者必读闭源云端通用大模型功能强大但在政府企业场景中使用存在若干问题  训练知识为网上通用，缺少政府和企业内部知识，不懂业务，无法解决实际问题  闭源模型云端部署，使用过程中数据外传上网，存在泄密风险  闭源模型规模庞大，无法为企业进行定制，无法本地部署  成本高昂，一般企业难以负担 50 政企、创业者必读  不追求用一个大模型解决企业所有问题，而是找垂直场景，做专业技能大模型 • 政府和企业不需要全能博士，需要管培生  企业内部未来一定是多个大模型组合工作 • 术业有专攻，专业的工作交给专业的模型去完成大模型能力很强但在企业中不要幻想用一个大模型解决所有问题 51 政企、创业者必读走开源的本地可部署的专业化大模型之路，许多问题就会迎刃而解参数：不需要千亿、万亿参数规模，百亿甚至几十亿就够用算力：不需要千卡、万卡运行大模型，单机单卡就可以跑起来成本：不需要投入千万、上亿资金，少量资金投入就可以能力：不需要等待下一代AGI面面俱到的能力响应：响应速度更快，用户体验更好部署：可以私有化部署，保障政府企业数据安全训练：不需要从头训练，只需要专业知识库或者微调就可以人才：大模型训练复杂程度降低，对人才要求也降低工具：已经有全套工具走专业化大模型之路，大模型落地门槛大幅降低从原子弹变成「茶叶蛋」 52 政企、创业者必读基于DeepSeek是打造专业大模型、垂直大