北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 DeepSeek-R1 在知识类问答上推动科学探索边界: MMLU \ MMLU-Pro \ GPQA Diamond 等 STEM- related 榜单上取得良好表现 R1 展现出强推理模型在 AI-Driven Research 的潜 力 在长文本依赖任务如 FRAMEs 和 事实性推断 任务 Si l QA 上表现突出 得益于强大的推理能力与长文本思考能力 , DeepSeek be More Effective than Scaling Model Parameters Laws [1] 。 DeepSeek-R1 Zero: 无需监督微调 SFT ,纯强化学习驱动的强推理模型 DeepSeek-R1 技术剖析: DeepSeek-R1 Zero 8 大规模推理为中心的强化学习,提升模型数学代码能力10 积分 | 76 页 | 6.72 MB | 5 月前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)系列专题线上公开课(第二季) 从大模型、智能体到复杂 AI 应用系统的构 建 —— 以产业大脑为例 肖俊 浙江大学计算机学科与技术学院人工智能研究所 2025 03 杭州 • 大模型推理能力快速提 升 • 推理模型和思维链 (CoT) • 智能体是什么? • 四链融合产业大脑案例 提纲 大模型推理能力快速提升 开始模仿人 脑进行大量 数据的标记 和训练 神经网络 CNN RNN GAN OpenAI o1/o3 、 DeepSeek- R1 等 1. 早期的大模型推理能力不足 2. OpenAI-o 系列模型和 DeepSeek-R1 等胜在推理能力较 强 小结一: 推理模型和思维链 (Chain of Thought, CoT) QwQ 由通义千问 开发, QwQ 能通 过思考与疑问解 决 一些复杂的问 题。 HIMl DeepSeek-R1 DeepSeek-R1 的推理过 程 s1 通过在一个精心构建的小规模数据集上( 1000 条数据) 进行微调, 并结合预算强制技术,实现了强大的推理能力和测试时计算扩展性 如何低成本实现推理模型? Less Is More for Reasoning LIMO 假说: 在预训练阶段已经充 分 编码领域知识的基础模型中, 复 杂 的推理能力可以通过最少但精 确编 排的认知过程演示来涌现:20 积分 | 61 页 | 13.10 MB | 1 天前3
山东大学:DeepSeek 应用与部署( Environment )中不断尝试、学习 ,并优化自己 的策略( Policy ) ,最终获得最大化的奖励 ( Reward )。 DeepSeek : 技术创新—推理模型 | RL DeepSeek 应用场 景 DeepSeek 的能力层级 • 1. 基础能力层 多模态数据融合与结构化理解 ,包括跨模态语义对齐(文本、 图像、 音频、 视频、 代 Qwen 蒸馏 的 DeepSeek - R1 推理模型 ,涵盖多种不同参数规模 ,适合想在本地运行模型的用户。 • 第三方 UI 客户管接入服务: 可通过 Anything LLM 、 Cherry Studio 、 Chatbox 等选择 API 接入。 • 秘塔 AI 搜索: 接入满血版 DeepSeek - R1 推理模型 , 无广告且搜索结果直达。 以学习 JDK21 新特性 siliconflow.cn/i/z0sI0urY 通过创建 API key 调 用 模型微调工程 u 对话模型微调 u 生图模型微调 华为云模型微调 老师模型 模型蒸馏工程 DeepSeek : 推理模型 | 推理能力 蒸馏 DeepSeek 蒸馏模 型 学生模型 小模型:相当于一枚小学生 ,知识面非常有限 ,但是胜在 没 教授那么大谱 ,给个板凳坐着就够了(部署成本低 ,推 理成 本低)。10 积分 | 79 页 | 6.52 MB | 5 月前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁关 键信息, 高效完成合同质检、条款比对等工作,大 幅 提升工作效率与准确性。 n 江苏银行已成功本地化部署微调 DeepSeek-VL2 多模态 模型、轻量 DeepSeek-R1 推理模型, 分别运用于智能 合同质检和自动化估值对账场景中。 资料来源:上海证券报,搜狐,中泰证券研究所 16 降本增效场景之三:智能合同质检 图表:江苏银行 AI 布 局 n AI Coding “抵押率”“偿债覆盖率”等术语转化为业务逻辑,应用于 合同 解析与风险建模 邮储银行 技术落地:依托自有大模型“邮智”,本地部署并集成 DeepSeek-V3 模型和 DeepSeek-R1 推理模型 应用场景:应用于智能客服“小邮助手”后,新增逻辑推理功能,可精准识别用户需求,提供个性化和场景化的服务方案,加快响应速度和任务处理效率 技术落地:“ AI 理财顾问”引入 DeepSeek 浦发银行 应用场景:融合“五横六纵”企业级知识库,嵌入数字员工助手应用,赋能智能问答、指标问答、财务分析、报告写作等多个应用场景 江苏银行 技术落地:部署 DeepSeek-VL2 多模态模型和 R1 推理模型 成效展示:合同质检准确率达 96% ,自动化估值对账场景日均节省 9.68 小时人工工作量,风险预警响应速度提升 20% DeepSeek 应用进展 数据来源:中电金信研究院公众号,中泰证券研究所10 积分 | 25 页 | 1.44 MB | 1 天前3
DeepSeek大模型赋能高校教学和科研20252 0 2 4 年 9 月 份 。 2 0 2 4 年 9 月 1 2 日 , OpenAI 官方宣布了 OpenAI o1 推 理大模 型。 OpenAI 定义推理模型 在 OpenAI 的官网上 , OpenAI 定义推理模 型是在回答之前进行思考 , 并在回复用户 之前 ,在内部生成一长串的思维链过程。 思维链是一种提示大语言模型进行逐步推 先显式地写出推理的中间步骤。这就像人 类解决复杂问题时会先把思考过程写下来 一样。 推理模型的核心 也就是说 ,如果模型在回复你之前有一 长 串的思考过程(这个过程必须可以显 示输 出) ,探索了很多不同的路径之后 给出答 案 ,那么有这个能力的大模型就 是推理大 模型。推理模型的核心在于处 理那些需要 多步骤逻辑推导才能解决的 复杂问题。 3.4 大模型的分 类 大语言模型可以分为通用大模型和推理大模型 Raschka 博士( Lightning AI 的首席教育学家) 将“推理”定义为通过生成中间步骤来回答复杂问 题的过程 通用的大语言模型( LLM ) 可能直接输出简短答案(如” 180 英里”) 推理模型的特点在于显式展示中间推导过程 3.4 大模型的分 类 特性 推理大模型 通用大模型 适用场景 复杂推理、 解谜、 数学、 编码难题 文本生成、 翻译、 摘要、 基础知识问答 复杂问题解决能力10 积分 | 123 页 | 15.88 MB | 5 月前3
DeepSeek在教育中的应用(72页 PPT)的开源特性是其一大亮点。用户可自行下载和部署 ,广大开发者共同优化。 4. 免费使用 DeepSeek 提供的服务是完全免费的 ,用户可以随时随地使用。 5. 支持联网搜索 DeepSeek 是首个支持联网搜索的推理模型 ,这使得它在信息获取方面独具优势。 6. 教育与培训资源丰富 开源模型为教育和培训提供了丰富的资源 ,有助于推动 AI 技术的普及和人才培养。 看看 deepseek 的方 位 DeepSeek DeepSeek 的 4 种方法 ① 通过青岛教育 e 平台 APP 访问: https://www.pgyer.com/cZfT 二、 APP 端使用 DeepSeek 的 2 种模型 推理模型( R1 ) 联网搜索模式( REG ) 通用模型 ( V3 ) 在传统的大语言模型基础 上 , 强化推理 、 逻辑分析 。 输出格式 为 Markdown 分部分 ,每部分不超过 300 字。 DeepSeek 高效 巧 推理模型 提示语只需明确 和需求 ,无需逐步指 导 DeepSeek R1 (推理 提示语过于详细,反倒限制其发挥20 积分 | 72 页 | 10.26 MB | 1 天前3
厦大团队:DeepSeek大模型赋能政府数字化转型层级 OpenAI 定义推理模型 在 OpenAI 的官网上 , OpenAI 定义推理 模 型是在回答之前进行思考 , 并在回复用 户 之前 ,在内部生成一长串的思维链过 程。 思维链是一种提示大语言模型进行逐步推 理的方法。它让模型在得出最终答案之前, 先显式地写出推理的中间步骤。这就像 人 类解决复杂问题时会先把思考过程写 下来 一样 推理模型的核心 也就是说 ,如果模型在回复你之前有一 ,如果模型在回复你之前有一 长 串的思考过程(这个过程必须可以显示输 出) ,探索了很多不同的路径之后给出 答 案 ,那么有这个能力的大模型就是推 理大 模型。推理模型的核心在于处理那 些需要 多步骤逻辑推导才能解决的复杂 问题 推理大模型 推理大模型的概念大规模传播应该开始于 2024 年 9 月份 2024 年 9 月 12 日 , OpenAI 官方宣 布了 OpenAI 时间 ” 的关系 , 再分步计算) 将“推理”定义为通过生成中间步骤来回答复杂问题的过程 2 个简单的例子: 通用的大语言模型( LLM ) 可能直接输出简短答案(如” 180 英里”) 推理模型的特点在于显式展示中间推导过程 1.4 大模型的分 类 Sebastian Raschka 博士( Lightning AI 的首席教育学家) : 特性 推理大模型 通用大模型 适用场景10 积分 | 121 页 | 13.42 MB | 5 月前3
解码DeepSeek构建医药行业新质生产力健康提醒 ⽩噪⾳帮助我⼊眠 ⽤户 19 基于 DeepSeek 病历讨论助⼿ 基于 DeepSeek 推理模型,整合患者的信息,辅助医⽣深度问诊、 鉴别诊断、病情分析和建议,提出治疗、预防等建议 • 基于 Deepseek ⼤模型,再现医⽣临床思维链路的推理模型 • ⾃动⽣成病情分析、 IDC ⾃动编码 • 分析准确率达 90% ,为医⽣提供权威决策⽀持0 积分 | 32 页 | 3.98 MB | 5 月前3
智能金融:AI驱动的金融变革(45页 PPT)(准确率奖励 + 可读性奖励) 第二阶段训练:增强通用能力,避免灾难性遗忘 推理导向强化学习 (准确率奖励 + 格式奖励) DeepSeek-R1 (强推理模型) 671B DeepSeek-R1-Zero (强推理模型) DeepSeek-V3 (基础模型) 面向全场景的强化学习 (规则奖励 + 奖励模型) 纯强化学习训练 多阶段增强训练 R1-Zero 生成的20 积分 | 45 页 | 4.10 MB | 1 天前3
疾控工作者应该怎么利用DeepSeek等AI大模型和 络 能 量 对 宇 由 字 理 论 的 摘 战 小 * SU7 四、国内外主要的大模型 4.2 国内的大模型产品 DeepSeek-R1 ( 深度求索 ) · 优点:开源推理模型,性能媲美顶级模型但成本仅为三十分之一,支持高效 分布式计算。 · 擅长内容:低成本推理、学术研究、中小企业应用。 · 缺点:需进一步优化以覆盖更复杂任务,生态建设尚在初期 豆包 ( 字节跳动 的 " 四大 天王 ", 管理资金规模均超过 600 亿元。这为 DeepSeek 提供了清晰的市场定位和投资 者背景 里程碑 2025 年 1 月 20 日推出 DeepSeek-R 1 推理模型 六、 DeepSeek 简介 6.4 DeepSeek 公司 CDC 疾控 人 概贵操队 牙 恒 桑 垃 $ v 3 % 拽 熄 桑 垃 $ R 1 % 设计初衷 想要在各种自然语言处理的任务中都 案, 满足好多领域的需求 适合学术研究、解决问题的应用和决策 支持系统等需要深度推理的任务,也能 拿来当教育工具,帮学生锻炼逻辑思维 六、 DeepSeek 简 介 6.5 生成模型与推理模型 CDC 疾控 人 桑垃同着 DeepSeek-R1-671B 满血版,能力最强 DeepSeek-R1-Distill-Qwen-7B 蒸馏版,能力稍弱 -- 实际上是增加了推理能力的20 积分 | 78 页 | 20.76 MB | 13 天前3
共 19 条
- 1
- 2
