金融-DeepSeek银行部署加速,AI金融应用迎来跃迁
1.44 MB
25 页
0 下载
3 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pptx | 3 |
| 概览 | ||
DeepSeek 银行部署加速, AI 金融应用迎来跃迁 分析师:闻学臣 执业证书编号: S0740519090007 分析师:王雪晴 执业证书编号: S0740524120003 分析师:苏仪 执业证书编号: S0740520060001 联系人:蒋丹 Email : jiangdan@zts.com.cn | 证 券 研 究 报 告 | 2 0 2 5 . 03 . 1 3 专 业 | 领 先 | 深 度 | 诚 信 中 泰 证 券 研 究 所 n DeepSeek 开源使金融机构能够轻松获得前沿模型能力,且大幅降低部署成本。其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。在实际银行落地应用 中,可能包括: 1 )降本增效:智能客服、信贷审批、合同质检; 2 )价值创造: AI 编程、智能风控、智能营销等; 3 ) 决 策赋能: 深度分析和决策辅助。 n 从实际落地应用情况看, 大行发力更早, 中小银行正在快速追赶。如工商银行、建设银行、招商银行等大行布局更早, 邮 储银行、浦发银行、江苏银行等也有较为领先布局应用。 AI 一体机的出现为机构提供了全新的解决方案,凭借其开箱 即 用、软硬件一体化设计等优势, 正在成为很多中小银行智能化转型的重要选择。 n 建议关注:宇信科技、京北方、天阳科技、长亮科技、百融云等。 n 风险提示 : AI 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和 long-CoT 能力涌现等) 。 图表:随步数提升 R1-Zero 的 AIME 任务准确度 图表:深度思考能力提升 性能:后训练阶段大规模应用强化学习,表现推理能力扩展 资料来源: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning ,中泰证券研究所 资料来源: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning ,中泰证券研究所 DeepSeek-R1-Zero 自然涌现 long-CoT 能力 DeepSeek-R1-Zero 的能力随步数提升 4 n DeepSeek 通过优化训练方法显著降低了算力消耗,使其在大规模数据处理中的成本更具优势。 它在 MoE 架构的基础上, 通过多头潜注意力机制( Multi-Head Latent Attention , MLA )进行优化;在后训练阶段采用冷启动 + 大规模强化学习 方 式,不再使用传统 SFT 做大规模监督微调, 甚至绕过了一些 CUDA ,采用 PTX 汇编来提升能力;在推理场景下通过 大规模 跨节点专家并行( Expert Parallelism , EP )来优化通信开销,尽可能实现负载均衡。 图表: DeepSeek R1 架构图 图表: DeepSeek R1 训练方法 资料来源: DeepSeek ,中泰证券研究所 资料来源:木尧,中泰证券研究所 5 性能: DeepSeek 推理架构优化,可适配银行高并行、高响应的业务场 景 n 以 DeepSeek R1 为代表的优秀开源模型的能力离闭源模型越来越近。行业普遍认为如果开源软件达到闭源 80% 以上能 力,就足以压缩闭源的生存空间。 DeepSeek 能力能够比肩 OpenAIo1 ,开源使各行业机构能够轻松获取前沿模型能力, 且可直接进行私有化部署或商业化开发。 开源易获得: DeepSeek 使私有化部署模型也能够追平前沿闭源模型水 平 图表:闭源模型与开源模型的差距正在缩小 资料来源: Epoch AI ,中泰证券研究 所 资料来源: AI 产品榜,中泰证券研究 所 图表: DeepSeek DAU 快速增 长 6 n DeepSeek 理论成本利润率极高,成本还有优化空间。通过优化, 能够在白天负荷高的时候,用所有节点部署推理服务。 晚上负荷低的时候,减少推理节点,以用来做研究和训练。以 2025 年 2 月 27-28 日数据为例, DeepSeek V3 和 R1 推 理服 务占用节点总和, 峰值占用为 278 个节点,平均占用 226.75 个节点(每个节点为 8 个 H800 GPU )。假定 GPU 租赁成 本为 2 美金 / 小时,总成本为 $87,072/ 天。如果所有 tokens 全部按照 DeepSeek R1 的定价计算,理论 上一天的总收入 为 $562,027 ,成本利润率 545% 。 图表: DeepSeek 服务负荷统计 图表: DeepSeek R1 成本与理论收入 成本: DeepSeek 低价策略下理论成本利润率依旧可达 545% ,部署成本极 低 资料来源: DeepSeek ,中泰证券研究所 资料来源: DeepSeek ,中泰证券研究所 7 n 阿里近期开源的 QwQ-32B 模型基于 320 亿参数规模,在数学推理、代码生成及通用任务中表现亮眼,综合性能对标 DeepSeek-R1 ( 6710 亿参数,激活量 370 亿)。该模型大幅降低部署成本, 支持在消费级显卡(如英伟达 RTX 4090 )上 本地运行,满足快速响应及数据安全需求。同时, QwQ-32B 集成智能体( Agent )能力,可调用工具并基于 环境反馈调 整推理逻辑,为定制化 AI 方案提供基础。 图表: QwQ-32B 模型表现 资料来源:阿里,中泰证券研究所 8 性能:开源 QwQ-32B 性能比肩满血 R1 ,再次降低部署成 本 n 通过将 DeepSeek-R1 的推理能力蒸馏到更小的模型中,较小的模型也能具备强大的推理能力。 DeepSeek 开源了从 15 亿 到 700 亿参数的 R1 蒸馏版本。这些模型基于 Qwen 和 Llama 等架构蒸馏, 表明复杂的推理能力可以被封装在更小、 更高效 的模型中。从论文结论看,蒸馏比单独依赖强化学习训练更为高效,且蒸馏与强化学习的结合可以进一步提升模型 性能。 n 2025 年 2 月,科学家李飞飞团队带领以不到 50 美元的费用训练了一个能力比肩 DeepSeek-R1 的 s1 模型,也展现了蒸馏 模 型的更多应用潜力。 性能:蒸馏小型模型展现 Test-time Scaling ,可支持多项基础业务场 景 资料来源: s1: Simple test-time scaling ,中泰证券研究所 9 模型展现出随推理时间增加准确度增加的 Test time Scaling S1 仅使用 1000 个微调示例就达到了类似 r1 的准 确度 资料来源: s1: Simple test-time scaling ,中泰证券研究 所 图表:各模型微调示例数与准确度对比 图表: s1 表现出的 Test time Scaling n DeepSeek 可以通过 API 接口或者数据中台架构,实现与传统银行技术系统的数据交互,从而实现各类业务高效高质的无 缝对接,有望释放海量私域数据价值。 Post-Train 阶段大规模强化学习的训练方法使模型拥有了更强的自主推理能力, 不 再依赖传统提示工程。根据 DeepSeek 的官方使用指南, 在使用模型时不建议添加系统提示( system prompt ),而 是所 有指令都应当包含在用户提示( user prompt )中。这也显示出了模型通用推理能力在应用中的扩展。 图表:大模型数据类型 Post-Train 阶段 数据:大规模 RL 提升非结构化数据分析能力,释放私域数据价 值 资料来源:中泰证券研究所 10 n Janus-Pro 结合了优化的训练策略,扩展了训练数据集和模型规模。通过这些改进, Janus-Pro 在多模态理解和文本到 图像的指令跟踪功能方面都取得了重大进步,同时还增强了文本到图像生成的稳定性。 n 作为在 GenEval 等评测中超越 DALL-E 3 和 Stable Diffusion 3-Medium 的开源模型, Janus-Pro 也展现出了更多应用潜力。 图表: Janus-Pro 多模态理解和视觉生成表现 资料来源: Janus-Pro: Unified Multimodal Understanding and Generation with Data and Model Scaling ,中泰证券研究所 11 多模态: Janus-Pro 等开源多模态模型有望进一步提升应用能 力 理解金融应用的“降本增效 - 价值创 造 - 决策赋能”三个层次 2 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 降本增效,价值创造与决策赋能。其中当下应用最广 泛的是降本增效, 即 AI 对简单人力的替代,具体场景可能包括智能客服、简单的办公文件问答与内容生成等。随着模 型能力提升将展现真正的价值创造能力,即 AI 对高价值人力的赋能, 具体场景可能包括办公 Agent 、营销、 Coding 等; 随着 AI 分析能力进一步提升,将能够为决策层直接赋能,提升决策效率和精确度。 图表:金融行业 AI 应用的三个层次 金融行业人工智能的三层价值创造 资料来源:中泰证券研究所 13 n 降本增效场景通常基于大模型的生成能力,进行人力替代或赋能,在银行业 AI 应用场景中落地最早。 n 商业银行主要通过人工客服和智能客服两种方式为客户提供咨询服务。人工客服工作强度高、处理和响应时间相对较长, 而当下智能客服难以覆盖全部服务场景。如工商银行在远程银行业务中将知识搜索与大模型生成能力结合,实现基于实 时通话向坐席人员主动推送答复话术或知识的能力。 图表:苏商银行大模型客服助手 资料来源:苏商银行、中泰证券研究所 14 降本增效场景之一:大模型承担智能客服角色 n 在传统银行信贷审批过程中,贷前调查、审批、放款以及贷后管理等诸多环节,均高度依赖人工操作,导致整个流程 十分复杂且效率低下。 DeepSeek 为银行信贷审批注入新动力, 助力审批流程实现智能化与自动化。 n 苏商银行应用 DeepSeek-VL2 多模态模型,通过构建“多模态技术 + 混合专家框架”的创新体系,实现对嵌套表格、影 像资料等复杂场景材料的精准解析,将信贷材料综合识别准确率提升至 97% 以上,信贷审核全流程效率提升了 20% 。 图表:苏商银行 AI 布局 资料来源:苏商银行公众号,中泰证券研究所 15 降本增效场景之二:大模型助力信贷审批 n 在银行的日常运营中,处理海量的合同、报表等文档 是一项繁琐且易出错的任务,传统人工审核方式效率 低下,难以满足业务需求。 DeepSeek-VL2 等多模态 模 型具备高精度的文档解析能力,能够提取文档中的 关 键信息, 高效完成合同质检、条款比对等工作,大 幅 提升工作效率与准确性。 n 江苏银行已成功本地化部署微调 DeepSeek-VL2 多模态 模型、轻量 DeepSeek-R1 推理模型, 分别运用于智能 合同质检和自动化估值对账场景中。 资料来源:上海证券报,搜狐,中泰证券研究所 16 降本增效场景之三:智能合同质检 图表:江苏银行 AI 布 局 n AI Coding 能够替代低效工作 ,充分释放开发者的价值。未来可能会由 AI 承担部分基础工作, 而开发者则转向更高层次的 架构设计和业务规划,专注于更复杂、更创造性的任务, 如架构设计、算法优化或用户体验创新。 n AI 编程在银行业可有效赋能内部研发。从具体用例看, 澳新银行对 1000 名软件开发人员进行了为期六周的 AI 编程助手试 用实验。实验发现,当软件开发人员使用 AI 编程助手时,平均生产率提高 42% ,代码质量提高 12% 。开发人员的工 作满 意度也显著提高。 价值创造场景之一: AI 编程赋能开发,释放开发价 值 资料来源:《采用 AI 编程助手,发展新质生产力》、中泰证券研究所 17 资料来源:《采用 AI 编程助手,发展新质生产力》、中泰证券研究 所 控制组平均用时(分钟) Copilot 组平均用时(分钟) 生产力提 升 60% 50% 40% 30% 20% 10% 0% Beginner Intermediate Advanced 图表:澳新银行 AI 编程对生产力的提 升 图表: AI 编程为软件开发带来的影 响 45 40 35 30 25 20 15 10 5 0 n 风控管理是银行业务经营的的核心任务之一, DeepSeek 拥有卓越的推理能力,能够助力银行显著提升风险识 别 的效率与准确性,快速剖析风险因素并生成详尽的分析报告,全面增强银行的风险管控能力。 n 重庆农村商业银行借助腾讯云大模型知识引擎的能力,率先在企业微信上线基于 DeepSeek 模型的智能助手应 用 “ AI 小渝” ,成为全国首批接入 DeepSeek 大模型应用的金融机构,也是首家通过知识引擎构建基于 DeepSeek 的联网应用的金融机构。 重庆农村商业银行将利用 DeepSeek 的模型能力,结合实时联网搜索以及 RAG 能力, 动态识别欺诈行为,提升风险预警精准度。 n 苏商银行通过深度融合 DeepSeek 系列模型技术, 构建“数据 + 算法 + 算力 + 场景”四位一体的智能决策体系, 该体系已成功应用于信贷风控、反欺诈监测等 20 余个业务场景,尽调报告生成效率提升 40% ,欺诈风险标签准 确率提升 35% ,构建起覆盖贷前、贷中、贷后的全生命周期智能风控网络。 18 价值创造场景之二:智能风控 n 智能营销助手:依托知识图谱与大模型的协同合作,银行能够精准捕捉客户信息, 量身定制个性化营销策略,精准触 达客户, 显著提升营销效果。 n 目前多家银行已利用 DeepSeek 布局智能营销场景。北京银行启动“ all in AI” 战略,并已部署 DeepSeek 系列模型,在 业务应用方面,北京银行利用大模型技术已在营销等场景落地应用。 图表:大模型 + 精准营销 资料来源: CSDN ,中泰证券研究所 19 价值创造场景之三: AI 赋能实现个性化智能营 销 n 大多数商业银行的决策模式主要依赖经验以及基于规则的系统,数据价值的挖掘和释放空间较大。 OpenAI 的 Deep Research 功能支持查找、分析和综合数百个在线资源,以研究分析师的水平创建综合报告。随着相关模型能力上限持 续 提升,决策层可应用 DeepSeek 深度挖掘和分析内外部数据,并为管理和决策赋能。 图表: Deep research 示例 决策赋能场景:高级分析能力赋能管理决策 资料来源: OpenAI ,中泰证券研究 所 20 机构 应用场景 工商银行 网点运营、远程银行、运营管理、人力资源、智慧办公、智能研发等 农业银行 智能问答、智能客服、辅助编程、智能办公、智能风控等 中国银行 内部知识服务、辅助编码等 建设银行 智能客服、市场营销、投研报告、智慧办公、智能运营、智能风控等 交通银行 办公助手、客服问答等 邮储银行 研发测试、运营管理、客户营销、智能风控、消费者权益保护等 中信银行 落地代码生成、智能操作等 平安银行 零售风控、零售贷款审批、运营管理、消保降诉、汽车金融等 招商银行 零售、批发、中后台 北京银行 宣传文案、智能周报、文章翻译、会议纪要等 江苏银行 智能客服、智能文档助手 杭州银行 知识问答、办公助手 n 在生成式人工智能落地应用中大行发力更早。六大国有银行大力投入大模型技术体系研发的同时多场景探索大模型应用, 实现客服、办公、研发、运营等多个业务领域的应用创新。中小银行则多以单场景切入, 探索智能客服、智慧办公等通 用场景下的更多应用,如探索智慧办公场景下的宣传文案、智能周报、文章翻译、会议纪要等细分场景。 n 我们认为,随着 DeepSeek 开源降本, 中小银行有望加速部署应用,快速追赶与大行之间差距。 资料来源:信通院、中泰证券研究所 21 落地进展:大行发力早,中小银行推进更快 50% 40% 30% 20% 10% 0% -10% -20% 2022 金融科技投入(亿元) 2023 金融科技投入(亿元) 同比增幅 300 250 200 150 100 50 0 资料来源:信通院、中泰证券研究所 图表:十二家上市银行金融科技投入 图表:部分银行大模型应用场景 n 大模型的本地部署并非易事,从模型训练到推理部署的全链路优化需要专业技术团队支持。 AI 一体机的出现提供了全 新的解决方案,凭借其开箱即用、软硬件一体化设计等优势,正在成为银行智能化转型的重要选择。 n 目前多家银行 IT 厂商已推出相关解决方案: - 宇信科技:智能营销、信创、监管和 AI 一体机等
| ||
下载文档到本地,方便使用
- 可预览页数已用完,剩余
23 页请下载阅读 -
文档评分


2025年DeepSeek金融审计应用场景1000问-南京审计大学金融学院(124页 WORD)
金融行业深度报告:Deepseek冲击波:AI赋能下的金融行业重构及变革