2025年DeepSeek手册:DeepSeek给我们带来的创业机会政企、创业者必读 国内DeepSeek最前沿资料 政企、创业者必读 《DeepSeek给我们带来的创业机会》 360集团创始人 周鸿祎 3 政企、创业者必读 政企、创业者必读 一张图读懂一堂DeepSeek课 政企、创业者必读 AI给了一个比互联网更大的机会 互联网是连接平台,人工智能是生产力 互联网是赋能性技术,生产力属性较弱 人工智能既能单兵作战,也能外部赋能 如果需要十万或百万张卡起玩,就无法 产生工业革命 • 只有把大模型拉下神坛,让大模型走进 千家万户、百行千业,才能掀起新一轮 工业革命 12 政企、创业者必读 DeepSeek出现之前 我们对大模型发展趋势的十大预判 13 政企、创业者必读 14 DeepSeek出现之前的十大预判 之一 传统AGI发展步伐在放慢 需要寻找新方向 Scaling Law边际效应递减 人类训练数据接近枯竭 合成数据无法创造新知识 推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立 政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式 大模型发展范式正在从「预训练」转向「后训练」和「推理时计算」 大模型厂商都在探索慢思考、思维链技术 政企、创业者必读 DeepSeek出现之前的十大预判 之三 模型越做越专 除了少数科技巨头,大多数公司都专注于做专业大模型10 积分 | 76 页 | 5.02 MB | 5 月前3
北京大学-DeepSeek原理和落地应用2025DeepSeek原理与落地应用 AI肖睿团队 (孙萍、吴寒、周嵘、李娜、张惠军、刘誉) 2025年03月01日 厦门大学大数据百家讲坛 • 北大青鸟人工智能研究院 • 北大计算机学院元宇宙技术研究所 • 北大教育学院学习科学实验室 7 人工智能概念辨析 DeepSeek R1 大模型原理 落地应用 目 录 C O N T E N T S 人工智能概念辨析 PART 01 01 大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具(国内) Ø DeepSeek、 豆包、Kimi、腾讯元宝、智谱清言、 通义千问、秘塔搜索、微信搜索... l 通用模型 Ø 大语言模型(LLM,Large Language Model) Ø 视觉模型(图片、视频) Ø 音频模型 Ø 多模态模型 Ø …… l 行业模型(垂直模型、垂类模型) Ø 教育、医疗、金融等 •编码器(BERT):多数embedding模型,Ernie早期版本,……. •混合网络:T5、GLM •解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心 •生成式人工智能(GenAI):AIGC •DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、…… •OpenAI GPT(ChatGPT)、Claude、Llama、Grok、…… •Diffusion架构:主要用于视觉模型(比如Stable10 积分 | 57 页 | 9.65 MB | 5 月前3
解码DeepSeek构建医药行业新质生产力解码 DeepSeek, 构建医药⾏业新质⽣产⼒ 07 • 从 DeepSeek 看⼈⼯智能发展趋势 • ⼤模型及 DeepSeek 潜在应⽤场景探 索 ⽬录 从 DeepSeek 看⼈⼯智能发展趋 势 AI 离我们越来越近,越来越密集的“加速”信 号 Alpha, ⼤战李世⽯ “AI” 概念⾯世 DS,“Aha” 时刻 CNN, ⼈脸识 别 Chatgpt, C 端破 圈 1950s )增强推理能⼒,将复杂问题 分 解成更⼩、更易处理的步骤;⽽ DeepSeek R1 在展现卓越推理能⼒同时, 训练和推理成本极低 GPT 为内容创造和自动推理开辟可能性 “大数据、大算力、通用模式” BERT BERT 在文本分类、命名实体识别等 语言理解任务表现出色。也是医疗 AI 小模型年代主要技术路线 “ 大数据、小算力、专用决策” DeepSeek-R1 基于 DS-v3 构建推理模 型,通过强化学习提升推 迹” Chatbot : ⽂本交互式应⽤ Gpt3 : 预训练⼤模型 6 DeepSeek 是“深度求索”开发的⼀系列⼈⼯智能模型。 DeepSeek 通过持续的技术 创新和市场拓展,在⾃然语⾔处理和⼤型语⾔模型⽅⾯取得了显著进展,在国际 市 场上获得了⼴泛认可。其中: • DeepSeek-V3 是在 14.8 万亿⾼质量 token 上完成预训练的⼀个强⼤的混合 专 家0 积分 | 32 页 | 3.98 MB | 5 月前3
化工DeepSeek时刻到了吗,化工龙头是否会重估?敬请参阅最后一页特别声明 1 本周化工市场综述 关于 DeepSeek,我们认为其对于大化工产业的竞争要素和商业模式可能会产生深远影响,具体到大化工各环节, 我们认为其对于设备、设计、筛选、流程优化,具体到投资方向,我们看好合成生物、农药创制药、新材料以及设备 端的投资机会。本周众多化工品涨价,比如:有机硅、香兰素、炭黑、金属铬、涤纶长丝、钾肥,我们继续看好金三 PB 历史分位数为 18%,PE 历史分位数为 65%。AI 行业边际变 化,一是市场担心 AI 行业拼算力逻辑有所变化,但本周欧盟追加 500 亿欧元投资缓解了市场担忧;另外一个重要事 件是 DeepSeek 7 天用户破亿,势如破竹,进而也引发了中国科技龙头估值重构,这也带来另外一个思考,即中国科 技龙头重估行情是否会扩散到化工龙头股?经过多轮行情的洗礼,中国已经走出了一批具备全球竞争力的细分赛道龙 MDI 装置 MDA 产能 12.8 万 t/a,粗 MDI 产能 16.176 万 t/a。。 2、中国信通院:正式启动 DeepSeek 国产化适配测评工作 中国信息通信研究院 13 日表示,正式启动 DeepSeek 国产化适配测评工作,旨在为 DeepSeek 系列模型在多硬件多场景下的适配部署提供参考。①一是评价模型在包括硬件 芯片、计算设备、智算集群等软硬件系统中的适配效果;②二是反映模型在软硬件系统适0 积分 | 22 页 | 2.66 MB | 5 月前3
2025年财务领域“AI+”:DeepSeek驱动下的财务创新报告10 积分 | 50 页 | 29.40 MB | 5 月前3
2025年DeepSeek赋能自智网络高阶演进评测报告����������������������������������� ����� DeepSeek ������������������������ ����������������������������������� ��������������������� DeepSeek �������������� � � �������������������� ������������������������������ ������� �DeepSeek ���������������������������� 2025 � 2 �� Test Report - DeepSeek Empowers the Advanced Evolution of Autonomous Networks, Ye Ouyang Yunxin Liu, et al, 2025.2. ������������������������������������������ 3 �� 1. DeepSeek �� ............................................................................................10 积分 | 40 页 | 16.72 MB | 5 月前3
北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 技术剖析 Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 RL 算法的创新: GRPO 及其技术细节 DeepSeek-R1 背后的 Insights & Takeaways : RL 加持下的长度泛化 \ 推理范式的涌现 DeepSeek-R1 社会及经济效益 技术对比探讨 STaR-based Methods 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? 得益于纯大规模强化学习 , DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 从基础模型开始构建,完全依赖强化学习,而不使用人类专家标注的监督微调(10 积分 | 76 页 | 6.72 MB | 5 月前3
腾讯云:2025年解码DeepSeek构建医药行业新质生产力报告07 解码DeepSeek,) 构建医药⾏业新质⽣产⼒ 腾讯健康 李慧 ⽬录 • 从DeepSeek看⼈⼯智能发展趋势 • ⼤模型及DeepSeek潜在应⽤场景探索 从DeepSeek看⼈⼯智能发展趋势 AI离我们越来越近,越来越密集的“加速”信号 4 “AI”概念⾯世 1950s 2012 CNN,$⼈脸识别 Alpha, ⼤战李世⽯ 2017 2022 Chatgpt (甲⼦光年智库梳理,2023年; DeepSeek-R1 • 1987-2020年之前的主导是“⼤数据、⼩算⼒、专⽤决策范式”。 • 2020年后,GPT-3代表技术路线“⼤数据、⼤算⼒、通⽤范式”,验证⼤语⾔模型的可⾏性。 • GPT3/4在深度推理和问题解决⽅⾯有所⽋缺,OpenAI-o1通过思维链(ChainvofvThought)增强推理能⼒,将复杂问题分 解成更⼩、更易处理的步骤;⽽DeepSeek R1在展现卓越推理能⼒同时,训练和推理成本极低 快速推出全家桶和云服务矩阵 市场:典型的B端商业模式 ‰ 快速市场预热和商业化 6 再看DeepSeek, ⼜⼀个“⼯程奇迹” 7 DeepSeek&是“深度求索” 开发的⼀系列⼈⼯智能模型。DeepSeek&通过持续的技术 创新和市场拓展,在⾃然语⾔处理和⼤型语⾔模型⽅⾯取得了显著进展,在国际市 场上获得了⼴泛认可。其中: • DeepSeek-V3 是在14.8万亿⾼质量 token 上完成预训练的⼀个强⼤的混合专10 积分 | 32 页 | 14.20 MB | 5 月前3
华泰证券:DeepSeek冲击下,AI产业对国内电力行业的变与不变免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 1 证券研究报告 工业/能源 DeepSeek 冲击下,AI 产业对国内电 力行业的变与不变 华泰研究 工业 增持 (首评) 能源 增持 (维持) 研究员 刘俊 SAC No. S0570523110003 SFC No 10 日│中国内地 动态点评 DeepSeek 带来 AI 行业变革,但对电力行业仍有三个不变的影响 DeepSeek R1 开源模型于 1 月 20 日发布,在更低的成本下实现和 OpenAI o1 相当的数学、代码、自然语言推理能力,不仅推动国内 AI 产业对海外的 快速追赶,也为 AI 相关行业带来较大变化。我们认为 DeepSeek 带来 AI 行业三个变化:成本变革,训练成本和 12%的复合增长,但 仅为美国同行增速的不到三分之二、总量的不到十分之一。根据 IDC 预测 2025-27 年国内人工智能服务器工作负载中超过 70%将用于推理,仅不到 30%为训练,因此即使 DeepSeek 大幅下降训练算力,对国内冲击相对较小。 根据信通院,截止 2022 年末中国算力规模 302EFlops,结合主要云厂资本开 支和芯片出货预测,我们预计 2024-26 年我国算力规模年复合增速有望达到0 积分 | 25 页 | 1.36 MB | 5 月前3
2025年以DeepSeek为代表的AI在能源行业的应用前景预测报告020年至今 AI 大模型出现并得到迅速发展,以Deepseek为代表的语义大模型出现。 4二、AI大模型的核心技术与特点 (一) 5 AI 大模型的成功是多类技术的积累,但其中最为核心的是自注意力 机制和Google 在2017 年提出的Self-Attention、Transformer 架构。 ChatGPT,Deepseek,豆包,Kimi都是基于该架构提出,具有以下三个特 中国海油,“海能”人工智能模型 ◼ 国家管网,“管网”大模型 4一、能源生产与管理 (一) 9 ◼ 新能源发电优化: 1、精准的功率预测:DeepSeek可构建更精准的新能源发电预测模型,对太阳能、风能等发电功率进行提前预测。例如,针对某风光装 机占比达58%的省级电网,DeepSeek通过构建考虑新能源场站波动特性的动态安全域模型,将弃光率从19%降至3.2%,日前预测精度提高 至94.7%。 2、优化调度决策:基于精准的发电预测,AI 1、新能源材料研发:DeepSeek的AI算法可应用 于新能源材料研发,如光伏材料、固态电池电解 质等,通过高通量模拟筛选候选材料,缩短实验 室验证周期。 2、能源技术创新:在能源新技术的研发过程中, DeepSeek可以作为智能助手,帮助科研人员进行 数据分析、模型建立、方案设计等工作,加速能 源技术的创新和突破。例如在新能源电池设计中, 让DeepSeek生成多个设计概念和初步方案,通过10 积分 | 29 页 | 2.37 MB | 5 月前3
共 22 条
- 1
- 2
- 3
