pdf文档 2025年DeepSeek手册:DeepSeek给我们带来的创业机会 VIP文档

5.02 MB 76 页 0 下载 38 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
概览
政企、创业者必读 国内DeepSeek最前沿资料 政企、创业者必读 《DeepSeek给我们带来的创业机会》 360集团创始人 周鸿祎 3 政企、创业者必读 政企、创业者必读 一张图读懂一堂DeepSeek课 政企、创业者必读 AI给了一个比互联网更大的机会  互联网是连接平台,人工智能是生产力  互联网是赋能性技术,生产力属性较弱  人工智能既能单兵作战,也能外部赋能 互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题 5 政企、创业者必读 大模型是真智能,是人工智能的重大拐点。你相不相信? 大模型是一场工业革命,将重塑所有产品和业务。你相不相信? 不拥抱AI的组织和个人,会被拥抱AI的组织和个人淘汰。你相不相信? 建立AI信仰 6 政企、创业者必读 大模型不是泡沫,而是新一轮工业革命的驱动引擎 蒸汽革命 电气革命 信息革命 以大模型为代表的 人工智能革命 人工智能是新质生产力的关键支撑技术,人工智能+百业千行将带动新一轮工业革命,为高质量发展注入强大动能 大模型的进一步突破将引领人类社会进入智能化时代,对我们的生活方式、生产方式带来巨大变革 重塑经济图景 解决复杂问题 7 政企、创业者必读 8 AI不仅是技术革新,更是思维方式和社会结构的变革 国家 产业 个人 企业 政企、创业者必读 人工智能发展历程(一)  从早期基于规则的专家系统,走向基于学习训练的感知型AI  从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI  从擅长理解的认知型AI,发展到擅长文字生成的生成式AI  从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI  从生成式AI,发展到推理型AI 专家系统 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9 政企、创业者必读 人工智能发展历程(二)  从单纯对话的大模型AI,发展到具有行动和执行能力的智能体AI  从数字空间中的AI,走向能理解和操控物理空间的AI  从解决现实问题的AI,走向解决科学问题的科学型AI 大模型AI 智能体AI 物理AI 科学AI 10 政企、创业者必读 面对全球大模型产业之争,要打赢「三大战役」 AGI之战 应用场景之战 大模型安全之战 • 探索超越人类的超级人工 智能AGI • 不仅是科技之争,更是国 运之争 • 不发展是最大的不安全, 发挥举国体制优势,打赢 追赶之战 • 大模型带来前所未有安全 挑战 • 外挂式传统安全手段难以 应对 • 应对模型安全新挑战,打 赢未雨绸缪之战 • 大模型是能力而非产品, 结合场景才能发挥价值 • 中国拥有最完整的产业链、 最全的工业门类、最丰富 的场景 • 发挥场景优势,加速传统 产业数转智改,打赢弯道 超车之战 AGI是全球少数玩家的游戏,政府、企业、创业者更多创新的机会在应用之路 11 政企、创业者必读 把大模型拉下神坛! 走入千家万户、百行千业,才能掀起新工业革命 • 当年IBM做出超级电脑,并没有带来工业 革命,因为只有少数人用 • IBM甚至声称,全世界只用5台电脑就够了 • 真正带来信息革命的是个人电脑走入千家 万户、百行千业 当年的电脑 当今的大模型 • 如果需要十万或百万张卡起玩,就无法 产生工业革命 • 只有把大模型拉下神坛,让大模型走进 千家万户、百行千业,才能掀起新一轮 工业革命 12 政企、创业者必读 DeepSeek出现之前 我们对大模型发展趋势的十大预判 13 政企、创业者必读 14 DeepSeek出现之前的十大预判 之一 传统AGI发展步伐在放慢 需要寻找新方向  Scaling Law边际效应递减  人类训练数据接近枯竭  合成数据无法创造新知识  推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立 政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式  大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」  大模型厂商都在探索慢思考、思维链技术 政企、创业者必读 DeepSeek出现之前的十大预判 之三 模型越做越专  除了少数科技巨头,大多数公司都专注于做专业大模型  MoE架构盛行,本质是多个专家模型组成一个大模型  Deepmind的Alpha系列产品是这一趋势的最佳诠释 16 政企、创业者必读 DeepSeek出现之前的十大预判 之四 模型越做越小 17  大模型进入「轻量化」时代,上车上终端,蒸馏小模型  先做得更大,然后探索能做多小 政企、创业者必读 DeepSeek出现之前的十大预判 之五 知识的质量和密度决定大模型能力  高质量数据、合成数据使模型知识密度的快速增长  大模型能以更少的参数量达到更高的性能  360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18 政企、创业者必读 DeepSeek出现之前的十大预判 之六 成本越来越低  过去一年,大模型成本「自由落体」  国外:GPT-4等效智能在过去18个月内价格下降240倍  国内:大模型「亏本」卖,可以「白嫖」大模型API能力 19 政企、创业者必读 DeepSeek出现之前的十大预判 之七 多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时,规模正在变小 20 政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地  能够调用各种工具,具有行动能力  调用企业专业知识,更懂企业  将日常重复性业务流程形成Playbook,实现流程自动化  通过目标拆解,多次调用大模型以及专家模型协同,形成 慢思考能力 传统软件是辅助人的工具,Agent是能够自主工作的数字员工,是新的生产力 政企、创业者必读 22 DeepSeek出现之前的十大预判 之九 开源效果追赶上闭源  技术开放,吸引广大开发人员和用户使用  很多公司参与开源,帮助改进产品,众人拾柴火焰高, 反哺开源产品,形成正循环 政企、创业者必读 DeepSeek出现之前的十大预判 之十 中美差距快速缩小  美国预训练堆算力的路线不可持续,有待发现新范式“换道超车”  软件和算法差距并不大,主要差距在工程、硬件等方面 23 政企、创业者必读 DeepSeek的出现验证了我们的预判 而DeepSeek的创新更具颠覆性 24 政企、创业者必读 DeepSeek是完美的颠覆式创新  技术创新——让过去做不到的事情可以做到  体验创新——让使用起来很难很复杂的东西变得很简单易用  市场推广创新——让过去很难得到的东西可以得到  商业模式创新——让过去很昂贵的东西变得很便宜甚至免费 DeepSeek正是符合这四种创新模式的完美例子 25 颠覆式创新的四种方式 政企、创业者必读 DeepSeek-R1突破了大模型Scaling Law瓶颈 导致大模型悲观论 认为大模型的能力无法进一步得到质的提升 开辟强化学习新范式 从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的 预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后,继续增大参数规 模难以带来质的提升 • 训练算力成本和工程化难度大幅上升 强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习,在不增大参 数规模前提下,大幅提升复杂推理能力 • 通过后训练算力和推理算力,在不增加 预训练算力前提下,大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26 政企、创业者必读  预训练模型如GPT——疯狂读书,积 累知识,Scaling law撞墙  预训练模型思考深度不够  算力见顶,变成少数巨头游戏 预训练大模型 推理大模型 预训练大模型难以通往AGI之路  推理模型如R1——通过逻辑链条推导答案, 分解规划,自我反思  预训练范式像是记忆和模仿,强化学习范 式更像探索实践  记住很多东西只是基础,真正有价值的是 融会贯通 R1找到了人类通往AGI的方向 DeepSeek颠覆式创新——技术创新 27 DeepSeek-R1和GPT-4o不是同一个物种 政企、创业者必读 快思考 慢思考 快 慢 人类真正智力表现 的形式 直觉经验型 速度快、准确性低 GPT、DeepSeek-V3擅长的 思考方式 推理能力获得突破的关键是学会了「慢思考」 例:课堂提问 快问快答  长思维链强大的推理能力是真正人类智力的体现  预训练大模型是人记忆和学习的能力,推理模型是对复杂问题 进行规划、分解、预测的能力,实现了真正的慢思考 28 例:课后作业 仔细思考 政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律,加速了AGI发展 Alpha Zero时刻 • Alpha Go采用监督学习, 使用人类棋谱训练 • Alpha Zero采用强化学习, 自己跟自己对弈 ChatGPT时刻 • OpenAI ChatGPT大模型, 通过预训练方式,实现涌 现,理解人类语言和知识 • 诞生预训练Scaling Law Deepseek-R1时刻 • o1采用强化学习,但训练复 杂推理能力,技术未公开 • DeepSeek-R1 探索出RL方 法,且公开技术 • 诞生推理型Scaling Law DeepSeek颠覆式创新——技术创新 29 政企、创业者必读 技术上实现对美国的赶超 掌握通向AI下一阶段的方法论 DeepSeek颠覆式创新——技术创新  美国人仍在遵循预训练Scaling law范式,走堆显卡路线,如 “星际之门”计划  中国DeepSeek-R1的创新突破,诞生推理型Scaling Law,改 写AI发展方向 30 政企、创业者必读 DeepSeek在用户体验上实现了三件事  更加理解用户需求,降低Prompt要求  直接呈现思维过程,展现像真人一样思考的能力  可实时联网,把搜索能力与推理能力结合 DeepSeek颠覆式创新——用户体验 具备强大推理能力,思维过程更加缜密,智能性提升 用起来更像真人,写作能力更强,想象力更丰富 31 政企、创业者必读 DeepSeek-R1用户体验改善的作用  R1在零广告投入下7天增长1亿用户,创最快应用破亿里程碑  把人工智能从不可用、凑合用,变成大家都能用、都爱用  推动市场加速发展,在中国用户、企业和政府彻底普及了一次AI  中国可能成为全球AI普及率、渗透率最高的国家, 加速了中国爆 发AI产业革命的步伐 DeepSeek颠覆式创新——用户体验 32 ——掀起新一轮AI科普教育 认知决定行动,这场全民AI科普对推动中国AI发展功不可没 政企、创业者必读 开源改变行业格局,建立强大生态  开源战胜闭源,促使全球公司、开发者等转到开源  建立强大生态,成为全球人工智能根技术,无推广情况下各国 政府、企业、云厂商纷纷接入,获得全球最大影响力  改变中美竞争格局:美国是闭源封闭垄断思路,中国领导开源 文化,加速中国领先地位  中国人民使用的AI工具先进性已超过美国,普及率超过美国, 使用AI人口超过美国总人口,且直接用上最先进的DeepSeek-R1 DeepSeek颠覆式创新——开源 33 政企、创业者必读 新时代下的集中力量办大事  每个企业都可以直接使用DeepSeek,因为开源透明可信任,企业和 政府可做大量私有化部署  一个开源产品获得突破之后,全世界都能分享成果,结束中国百模大 战,节省大量成本  很多公司参与开源,帮助改进产品,很多人基于DS生态开发应用产 品,增加影响力,人人为我,我为人人  技术开放,对人工智能行业形成蓬勃发展,寒武纪大爆炸,推动AGI 行业发展 DeepSeek颠覆式创新——开源 34 政企、创业者必读 成本的急剧降低  DeepSeek可适配国产硬件,促进国产硬件发展  DeepSeek的优化降低对推理硬件的要求,减少推理成本  训练成本降低,堆显卡模式受质疑,探索新思路,算法优化空间大  无需训练自己的基座模型,直接部署在DeepSeek上,不用重复发明轮子  公开蒸馏方法,帮助其他模型提升能力,实现了模型制造模型,犹如工业母机  小模型可部署在企业内电脑或一体机上,使用成本降低,形成分布式推理网络  技术门槛降低, 可标准化、SaaS化部署,下载就能用 DeepSeek颠覆式创新——成本暴跌 35 政企、创业者必读 惠及全球人民,科技平权,技术平民化  运营商、云服务可免费用,降低云服务成本  大型企业可使用多个DeepSeek,解决不同场景需求  中小企业免费部署,消除数字鸿沟  个人可以拥有自己的DeepSeek ,可以成为超级个体  对于创业者得到世界最先进大模型,如虎添翼,和巨头站在 同一起跑线上  很多发展中国家都能成为大模型玩家,实现人类命运共同体 DeepSeek颠覆式创新——免费 36 政企、创业者必读 DeepSeek引爆应用奇点 东西又好又免费,每个人都能拥有 DeepSeek颠覆式创新——结论  企业中各场景都可用DeepSeek改进,降本增效,企业应用爆发  所有产品都值得被DeepSeek重构,产品应用爆发  创业公司得到DeepSeek加持,创业者拥有便宜领先的大模型,迎来 机遇,带来“iPhone时刻” 中国变成AI渗透率最高的国家,率先实现AI工业革命 37 政企、创业者必读 人人智能 万物智能 数转智改 未来产业 科学研究 安全 应用爆发的六大方向 38 政企、创业者必读 DeepSeek的开源和低成本使得个人也能够拥有自有大模型,实现超能力, 成长为超级个体 DeepSeek六大应用方向之一 人人智能:人人都要用AI 39 政企、创业者必读 真正的机会是利用AI把所有的硬件重做一遍 DeepSeek六大应用方向之二 万物智能:所有智能硬件都用AI重做 40 政企、创业者必读 DeepSeek六大应用方向之三 数转智改:助力传统产业打造新质生产力 用大模型帮助传统产业、制造业实现“数转智改”,利用AI降本增效 41 政企、创业者必读 DeepSeek六大应用方向之四 未来产业:变不可能为可能 42  DeepSeek的技术为机器人、智能网联车、无人机、机器狗 等带来巨大改进,降低成本和算力要求  低成本低算力需求使得模型更容易被部署到机器人等智能设 备上,解决物理现实世界的认知、决策和行动问题 政企、创业者必读 赋予自动驾驶复杂物理世界理解能力 从规则驱动到学习驱动 43 政企、创业者必读  人工智能的目标是星辰大海,是为了让人类在科技上有突破  基于DeepSeek的强推理模型,利用科学领域专业知识进行强化学习, 能够打造更加专业的科学推理模型 DeepSeek六大应用方向之五 科学研究:打造科研新范式 44 政企、创业者必读 AI For Science,为基础科学带来革命性变化 2024诺贝尔化学奖颁发给研发AlphaFold的两位AI专家 未来所有科学研究都将以AI为中心 过去如何做蛋白质研究 AlphaFold 1. X射线晶体衍射 2. 核磁共振 3. 冷冻电子显微镜 1. 利用Transformer的预测能力, 2. 直接从蛋白质的氨基酸序列 3. 中预测蛋白质的3D结构 靠肉眼观察,几年才能发现一个复杂蛋 白质结构,半个世纪预测了20多万种 从数年缩短到几分钟,解开了生物学密码 成功预测了地球存在的2亿种蛋白质结构 45 政企、创业者必读  DeepSeek典型的四大安全问题:客户端安全、Agent安全、知识安全、模型安全  360提出「以模制模」新解法,应对DeepSeek安全问题 DeepSeek六大应用方向之六 AI安全:实现安全的「自动驾驶」 46 政企、创业者必读 大模型的六大能力 47 基本 能力 业务 能力 创新 能力 赋能 未来产业 创意 能力 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science 知识管理( 内部知识管理、 外部情报分析、 大数据分析、 工作流知识) 专家经验模型( 专业模型训练) 业务流程自动化( A g e n t框架) 组织协同( 工作流) 人机交互 赋能个人和 企业员工 生产力提升 多模态 能力 3 图片理解和处理 视频理解和处理 音频理解和处理 非结构化文档处理 47 政企、创业者必读 DeepSeek能力很强大 个人使用绰绰有余 但要在政府、企业应用需要和场景结合  大模型要藏在产品后面  客户要的不是电动机,是「刮胡刀」「吹风机」  没有人会买一个电动机后,说「来,给爷表演一下27000转」 48 政企、创业者必读 如何解决 DeepSeek在政府、企业的应用问题? 49 政企、创业者必读 闭源云端通用大模型功能强大 但在政府企业场景中使用存在若干问题  训练知识为网上通用,缺少政府和企业内部知识,不懂业务,无 法解决实际问题  闭源模型云端部署,使用过程中数据外传上网,存在泄密风险  闭源模型规模庞大,无法为企业进行定制,无法本地部署  成本高昂,一般企业难以负担 50 政企、创业者必读  不追求用一个大模型解决企业所有问题,而是找垂直场景,做专业技能大模型 • 政府和企业不需要全能博士,需要管培生  企业内部未来一定是多个大模型组合工作 • 术业有专攻,专业的工作交给专业的模型去完成 大模型能力很强 但在企业中不要幻想用一个大模型 解决所有问题 51 政企、创业者必读 走开源的本地可部署的专业化大模型之路,许多问题就会迎刃而解 参数:不需要千亿、万亿参数规模,百亿甚至几十亿就够用 算力:不需要千卡、万卡运行大模型,单机单卡就可以跑起来 成本:不需要投入千万、上亿资金,少量资金投入就可以 能力:不需要等待下一代AGI面面俱到的能力 响应:响应速度更快,用户体验更好 部署:可以私有化部署,保障政府企业数据安全 训练:不需要从头训练,只需要专业知识库或者微调就可以 人才:大模型训练复杂程度降低,对人才要求也降低 工具:已经有全套工具 走专业化大模型 之路,大模型落 地门槛大幅降低 从原子弹变成 「茶叶蛋」 52 政企、创业者必读 基于DeepSeek是打造专业大模型、 垂直大
下载文档到本地,方便使用
共 76 页, 还有 1 页可预览, 继续阅读
文档评分
请文明评论,理性发言.