推理模型 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

北大：DeepSeek-R1及类强推理模型开发解读

DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读陈博远北京大学 2022 级“通班” 主要研究方向：大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 DeepSeek-R1 在知识类问答上推动科学探索边界： MMLU \ MMLU-Pro \ GPQA Diamond 等 STEM- related 榜单上取得良好表现 R1 展现出强推理模型在 AI-Driven Research 的潜力在长文本依赖任务如 FRAMEs 和事实性推断任务 Si l QA 上表现突出得益于强大的推理能力与长文本思考能力， DeepSeek be More Effective than Scaling Model Parameters Laws [1] 。 DeepSeek-R1 Zero: 无需监督微调 SFT ，纯强化学习驱动的强推理模型 DeepSeek-R1 技术剖析： DeepSeek-R1 Zero 8 大规模推理为中心的强化学习，提升模型数学代码能力

10 积分 | 76 页 | 6.72 MB | 1 年前
3
北京大学-DeepSeek原理和落地应用2025

视觉模型），部分新的多模态模型架构大模型的发展阶段生成模型 ref:中文大模型基准测评2024年度报告(2025.01.08) 推理模型生成模型与推理大模型的对比比较项 OpenAI GPT-4o（生成模型） OpenAI o1（推理模型）模型定位专注于通用自然语言处理和多模态能力，适合日常对话、内容生成、翻译以及图文、音频、视频等信息处理、生成、对话等。侧界面友好，适合大众使用。可自主链式思考，不需要太多的过程指令，整体交互节奏较慢。 D e e p S e e k R 1 PART 02 DeepSeek公司 2025年1月20日推出DeepSeek-R1推理模型作为由知名私募巨头幻方量化孕育而生的公司，DeepSeek获得了强大的资金支持和行业影响力，幻方量化与九坤投资、明汯投资、灵均投资并称量化私募领域的“四大天王”，管理资金规模均超过60 究与开发公司成立背景与发展历程大语言模型(LLM) 的创新应用投资者背景与市场定位里程碑 DeepSeek模型系列 DeepSeek最新的生成模型和推理模型版本对比比较方面生成模型（V3）推理模型（R1）设计初衷想要在各种自然语言处理的任务中都能表现好，更通用重点是为了搞定复杂的推理情况，比如深度的逻辑分析和解决问题性能展现在数学题、多语言任务还有编码任务

10 积分 | 57 页 | 9.65 MB | 1 年前
3
2024年中国人工智能产业研究报告

2）可行逻辑-原本小模型在某些场景能力无法达到，大模型具备可行性 3）创新逻辑-大模型发掘了客户需求，在需求侧未提出要求情况下创造新场景需求各家积极发展结合强化学习、思维链的“后训练“，推出深度推理模型。在效率优化方面，稀疏注意力、线性注意力等相关机制可大幅降低内存和计算成本。正朝着处理更长序列、更大规模数据和实时应用场景的方向发展，新型高效注意力算法和硬件协同优化可能成为重要突破口。刻感知。系统一直觉和本能系统二理性 • 快思考：快速、自动、直觉性、无意识 • 原本GPT系列思考形态更类似于系统一 • 慢思考：缓慢、需要努力、逻辑性、有意识 • 推理模型加强推理思考能力，思考形态往系统二倾斜 95% 5% 自大模型发布以来，Scaling Law成为模型层发展迭代共识，国内大模型基座厂商均通过不断加大参数量级以获得模型能力的优化增强。 20 （RM）训练，通过收集人类反馈数据训练奖励模型，评估输出质量；以及强化学习（RL），利用奖励模型反馈优化模型，最终生成更符合人类偏好的输出等。由于代码、数学等领域更适配模型评估与奖励反馈环节，推理模型在这些领域的深度思考能力更强，而在文学、医药、科研等领域，因存在大量实验数据和非唯一最优解等影响，后训练的效果提升相对有限。从落地质效来看，DeepSeek通过创新的模型结构和训练任务优化，如多令牌预测

10 积分 | 51 页 | 3.35 MB | 1 年前
3
2024年中国人工智能产业研究报告

2）可行逻辑-原本小模型在某些场景能力无法达到，大模型具备可行性 3）创新逻辑-大模型发掘了客户需求，在需求侧未提出要求情况下创造新场景需求各家积极发展结合强化学习、思维链的“后训练“，推出深度推理模型。在效率优化方面，稀疏注意力、线性注意力等相关机制可大幅降低内存和计算成本。正朝着处理更长序列、更大规模数据和实时应用场景的方向发展，新型高效注意力算法和硬件协同优化可能成为重要突破口。刻感知。系统一直觉和本能系统二理性 • 快思考：快速、自动、直觉性、无意识 • 原本GPT系列思考形态更类似于系统一 • 慢思考：缓慢、需要努力、逻辑性、有意识 • 推理模型加强推理思考能力，思考形态往系统二倾斜 95% 5% 自大模型发布以来，Scaling Law成为模型层发展迭代共识，国内大模型基座厂商均通过不断加大参数量级以获得模型能力的优化增强。 20 （RM）训练，通过收集人类反馈数据训练奖励模型，评估输出质量；以及强化学习（RL），利用奖励模型反馈优化模型，最终生成更符合人类偏好的输出等。由于代码、数学等领域更适配模型评估与奖励反馈环节，推理模型在这些领域的深度思考能力更强，而在文学、医药、科研等领域，因存在大量实验数据和非唯一最优解等影响，后训练的效果提升相对有限。从落地质效来看，DeepSeek通过创新的模型结构和训练任务优化，如多令牌预测

0 积分 | 51 页 | 3.35 MB | 1 年前
3
2025年DeepSeek手册：DeepSeek给我们带来的创业机会

预训练模型如GPT——疯狂读书，积累知识，Scaling law撞墙  预训练模型思考深度不够  算力见顶，变成少数巨头游戏预训练大模型推理大模型预训练大模型难以通往AGI之路  推理模型如R1——通过逻辑链条推导答案，分解规划，自我反思  预训练范式像是记忆和模仿，强化学习范式更像探索实践  记住很多东西只是基础，真正有价值的是融会贯通 R1找到了人类通往AGI的方向 GPT、DeepSeek-V3擅长的思考方式推理能力获得突破的关键是学会了「慢思考」例：课堂提问快问快答  长思维链强大的推理能力是真正人类智力的体现  预训练大模型是人记忆和学习的能力，推理模型是对复杂问题进行规划、分解、预测的能力，实现了真正的慢思考 28 例：课后作业仔细思考政企、创业者必读 DeepSeek-R1是AI发展史上的重要里程碑 R1形成了新的AGI定律，加速了AGI发展赋予自动驾驶复杂物理世界理解能力从规则驱动到学习驱动 43 政企、创业者必读  人工智能的目标是星辰大海，是为了让人类在科技上有突破  基于DeepSeek的强推理模型，利用科学领域专业知识进行强化学习，能够打造更加专业的科学推理模型 DeepSeek六大应用方向之五科学研究：打造科研新范式 44 政企、创业者必读 AI For Science，为基础科学带来革命性变化 2024

10 积分 | 76 页 | 5.02 MB | 1 年前
3
DeepSeek银行部署加速，AI金融应用迎来跃迁（25页 PPT）

型具备高精度的文档解析能力，能够提取文档中的关键信息，高效完成合同质检、条款比对等工作，大幅提升工作效率与准确性。 n 江苏银行已成功本地化部署微调 DeepSeek-VL2 多模态模型、轻量 DeepSeek-R1 推理模型，分别运用于智能合同质检和自动化估值对账场景中。资料来源：上海证券报，搜狐，中泰证券研究所 16 降本增效场景之三：智能合同质检图表：江苏银行 AI 布局 n AI Coding 将“抵押率”“偿债覆盖率”等术语转化为业务逻辑，应用于合同解析与风险建模邮储银行技术落地：依托自有大模型“邮智”，本地部署并集成 DeepSeek-V3 模型和 DeepSeek-R1 推理模型应用场景：应用于智能客服“小邮助手”后，新增逻辑推理功能，可精准识别用户需求，提供个性化和场景化的服务方案，加快响应速度和任务处理效率技术落地：“ AI 理财顾问”引入 DeepSeek 应用场景：融合“五横六纵”企业级知识库，嵌入数字员工助手应用，赋能智能问答、指标问答、财务分析、报告写作等多个应用场景江苏银行技术落地：部署 DeepSeek-VL2 多模态模型和 R1 推理模型成效展示：合同质检准确率达 96% ，自动化估值对账场景日均节省 9.68 小时人工工作量，风险预警响应速度提升 20% DeepSeek 应用进展数据来源：中电金信研究院公众号，中泰证券研究所

10 积分 | 25 页 | 1.44 MB | 4 月前
3
国信证券-从多邻国的成功经验，探析中国本土教育企业“AI+”战略的路径异同

有道产品矩阵 ...................................................................... 22 图23：集成 Deepseek-R1 推理模型的有道 Spaceone ............................................22 图24：好未来公司历程 ........................ 端、消费电子硬件）高效运行，本地部署意味着企业使用时对其数据、硬件和软件配置拥有完全的控制权，同时端侧使用也可避免网络拥堵等现象。请务必阅读正文之后的免责声明及其项下所有内容证券研究报告 9 DeepSeek 等深度推理模型最为核心特征在于优化 CoT 能力后，可展现思考过程、分步骤提供解决方案。深度优化的 CoT（思维链）能力使模型突破在交流时不单单提供最终答案，而是展现出类人类的推理过程拆解能力。这意味着：用者给出详尽的提示词以进行信息匹配，进而使用者给出的提示词一定程度会影响模型处理任务的效果。而 DeepSeek 等深度推理模型即使提示词不够详尽也能根据已知信息推断出合适的回答或解决方案。 2）完整逻辑分析链条在解决数学等复杂逻辑问题时更具优势。相较于传统 LLM 依赖统计模式匹配的解题方式，深度推理模型能够解析数学公式的语法结构，并在多步推导中保持严格的逻辑一致性。 3）此外思维链技术赋予了模型展现解题思路的功能，较直接展示答案便于使用

10 积分 | 36 页 | 2.48 MB | 1 年前
3
央国企数字化应用实践报告

将这类模型称为非推理模型。然而，当前备受关注的 OpenAI o1 和 DeepSeek R1 则代表了推理模型。这类模型以慢速、深思熟虑、逻辑性的方式运行，通过强化学习训练，在回答问题之前会通过思维链进行“思考”，思考时间越长，在推理任务上的表现就越好。这种思维方式需要有意识的努力和思考，用于解决复杂问题或做出深思熟虑的决策。非推理模型和推理模型各有所长，未来企业需要同时部署这两类模型，这超出了此前的预期。在 DeepSeek R1 出现之前，企业尚未意识到推理模型的快速发展和广泛应用。当前，企业的算力规划主要针对非推理模型，而未来则需要同时支持非推理和推理两类模型，因此对算力的需求将显著增加。（2）用户数量激增 DeepSeek 的破圈效应相当于对全民进行了一次 AI 普及教育，其影响力远超企业内部的任何一次培训。预计会有更多央国企员工主动使用

10 积分 | 73 页 | 7.01 MB | 1 年前
3
解码DeepSeek构建医药行业新质生产力

健康提醒⽩噪⾳帮助我⼊眠⽤户 19 基于 DeepSeek 病历讨论助⼿基于 DeepSeek 推理模型，整合患者的信息，辅助医⽣深度问诊、鉴别诊断、病情分析和建议，提出治疗、预防等建议 • 基于 Deepseek ⼤模型，再现医⽣临床思维链路的推理模型 • ⾃动⽣成病情分析、 IDC ⾃动编码 • 分析准确率达 90% ，为医⽣提供权威决策⽀持

0 积分 | 32 页 | 3.98 MB | 1 年前
3
腾讯云：2025年解码DeepSeek构建医药行业新质生产力报告

科研与学术⽅式和效率→通过⼤模型进⾏科研课题筛选、⽂献收集、数据结构化提取和分析、摘要及初稿撰写等医⽣基于DeepSeek推理模型，整合患者的信息，辅助医⽣深度问诊、鉴别诊断、病情分析和建议，提出治疗、预防等建议 • 基于Deepseek⼤模型，再现医⽣临床思维链路的推理模型 • ⾃动⽣成病情分析、IDC⾃动编码 • 分析准确率达90%，为医⽣提供权威决策⽀持 • 指出权威出处（如指南、专家共识等）

10 积分 | 32 页 | 14.20 MB | 1 年前
3

共 31 条前往

页

分类

语言

格式

北大：DeepSeek-R1及类强推理模型开发解读

北京大学-DeepSeek原理和落地应用2025

2024年中国人工智能产业研究报告

2024年中国人工智能产业研究报告

2025年DeepSeek手册：DeepSeek给我们带来的创业机会

DeepSeek银行部署加速，AI金融应用迎来跃迁（25页 PPT）

国信证券-从多邻国的成功经验，探析中国本土教育企业“AI+”战略的路径异同

央国企数字化应用实践报告

解码DeepSeek构建医药行业新质生产力

腾讯云：2025年解码DeepSeek构建医药行业新质生产力报告