R1 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

DeepSeek银行部署加速，AI金融应用迎来跃迁（25页 PPT）

训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果，有望进一步催生银行落地应用。核心观点 DeepSeek 开源、低成本、强推理助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法， R1-Zero 版本模型使用纯强化学习方大规模跨节点专家并行（ Expert Parallelism ， EP ）来优化通信开销，尽可能实现负载均衡。图表： DeepSeek R1 架构图图表： DeepSeek R1 训练方法资料来源： DeepSeek ，中泰证券研究所资料来源：木尧，中泰证券研究所 5 性能： DeepSeek 推理架构优化，可适配银行高并行、高响应的业务场景 n 以 DeepSeek R1 为代表的优秀开源模型的能力离闭源模型越来越近。行业普遍认为如果开源软件达到闭源 80% 以上能力，就足以压缩闭源的生存空间。 DeepSeek 能力能够比肩 OpenAIo1 ，开源使各行业机构能够轻松获取前沿模型能力，

10 积分 | 25 页 | 1.44 MB | 2 月前
3
智能金融：AI驱动的金融变革（45页 PPT）

（强推理模型） DeepSeek-V3 （基础模型）面向全场景的强化学习（规则奖励 + 奖励模型）纯强化学习训练多阶段增强训练 R1-Zero 生成的长思维链数据综合性能更强 R1 蒸馏版 1.5B~32B 对 V3 模型监督微调混合数据监督微调 60 万条推理数据模型蒸馏是一种将大型复杂模型（教师模型）的知识迁移到小型高效模型（学生模型）的模型压缩技术算法共振与羊群效应 OpenAI ：推理增强会明显减少幻觉！ DeepSeek R1 实测：推理增强后幻觉率增加！过度延展的推理机制训练数据的奖励偏差解决方案？面临挑战 3 ：创造力与幻觉率悖论？根据 Vectara 的测试， R1 的幻觉率 14.3% ，显著高于其前身 V3 的 3.9%

20 积分 | 45 页 | 4.10 MB | 4 月前
3
央国企数字化应用实践报告

接应用于业务场景。然而，DeepSeek 开源的 DeepSeek R1 模型为这一困境带来了突破性解决方案。通过开源，DeepSeek R1 使央国企的大模型能够理解业务逻辑，从而为“深水区”场景的落地提供了可能。目前，央国企可通过以下三种方式实现这一目标： l 模型蒸馏与能力迁移：央国企可通过蒸馏 DeepSeek R1 获取推理能力，并将其“复制”到自有模型上，快速提升模型的业务适配性。 DeepSeek R1 则代表了推理模型。这类模型以慢速、深思熟虑、逻辑性的方式运行，通过强化学习训练，在回答问题之前会通过思维链进行“思考”，思考时间越长，在推理任务上的表现就越好。这种思维方式需要有意识的努力和思考，用于解决复杂问题或做出深思熟虑的决策。非推理模型和推理模型各有所长，未来企业需要同时部署这两类模型，这超出了此前的预期。在 DeepSeek R1 出现之前，企业工具来解决工作问题，以提升效率和质量。用户数量的激增将导致对算力的需求大幅超过企业原有的规划。 | 2024 爱分析央国企数字化应用实践报告 26 （3）训练与蒸馏如果央国企希望对 DeepSeek R1 进行蒸馏，将其推理能力复制到自身的大模型上，或者参照 DeepSeek 公开的技术路径，从头构建思维链数据并通过微调、强化学习等方式改造自有模型，这些操作都将显著增加对算力的需求。根据

10 积分 | 73 页 | 7.01 MB | 10 月前
3
企业竞争图谱：2025年智能物流车头豹词条报告系列

2015-01-01~2019-01-01 2015年底：Starship Technologies推出第一台配送机器人; 2016年7月：开始送货服务试点; 2018年1月：Nuro.ai推出第一代送货机器人R1，12月投入试点; 2019年：亚马逊Scout、联邦快递Roxo项目启动。海外企业主导技术突破，产品初步商业化试点。规模化发展期 2020-01-01~2022-01-01 4 智能物流车行业产业链上游为核心零部件供应环节

10 积分 | 18 页 | 5.05 MB | 2 月前
3
《中国数字营销生态图(2025版)》解读报告-虎啸

拟不同背景的人类个体，为市场调研、用户洞察等任务提供全新解决方案。 l 中国力量改写全球格局 2025年，中国AI企业的突破性进展改写了全球技术格局。1月，深度求索(DeepSeek)完全开源旗舰大模型R1，以“技术平权”为理念引发全球关注。96小时内登顶 Arena全球榜单第三，创下GitHub中文开源项目历史纪录。 DeepSeek以仅557.6万美元的训练成本（行业平均的5%）实现了

10 积分 | 107 页 | 2.65 MB | 2 月前
3

共 5 条前往

页

分类

语言

格式

DeepSeek银行部署加速，AI金融应用迎来跃迁（25页 PPT）

智能金融：AI驱动的金融变革（45页 PPT）

央国企数字化应用实践报告

企业竞争图谱：2025年智能物流车头豹词条报告系列

《中国数字营销生态图(2025版)》解读报告-虎啸

分类

语言

格式

DeepSeek银行部署加速，AI金融应用迎来跃迁（25页 PPT）

智能金融：AI驱动的金融变革（45页 PPT）

央国企数字化应用实践报告

企业竞争图谱：2025年智能物流车 头豹词条报告系列

《中国数字营销生态图(2025版)》解读报告-虎啸

企业竞争图谱：2025年智能物流车头豹词条报告系列