2025年智启未来·险见新机-人保寿险大模型探索及实践(33页 PPT)
2.82 MB
33 页
0 下载
3 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pptx | 3 |
| 概览 | ||
智启未来 · 险见新机 —— 人保寿险大模型探索及实践 中国人民人寿保险股份有限公司 呼群 01 公司简介 02 大模型 技术探索 大模型 实践应用 目 录 03 2 保险、年金保险、健康保险、意外伤害保险等保险业务及其再保险业务。公司总部设在北京 ,机构网点布局完善, 在全国 31 个省、 自治区、直辖市和 5 个计划单列市设立 36 个省级分公司。 下拥有人保财险、人保寿险、人保资产、人保健康、 中诚信托、人保养老、人保投控、人保资本、人保再保、人 保 科技、人保香港等 11 家子公司及成员公司 ,业务范围覆盖财产险、人身险、再保险、资产管理、保险科技等 领域。 简称“ 中国人保” ,成立于 1949 年 10 月 20 日 , 为综合性保险金融集团 ,连续 15 年入选《财富》世界 500 强 ,旗 简称“人保寿险” ,成立于 2005 年 11 月 ,是中国人民保险集团股份有限公司旗下的重要成员 ,主要经营人 寿 70 年 + 品牌沉淀 ,全力保障国计民 生 中国人民保险集团股份有限公司 中国人民人寿保险股份有限公司 10+ 专业子公司 ,业务涵盖广 泛 10000+ 网点机构 ,覆盖全国城 乡 公司简介 3 01 公司简介 02 大模型 技术探索 大模型 实践应用 目 录 03 4 人工智能发展历程 5 规模到达临界点之后才会迅速增长 GPT-4 模型参数: 1.8 万亿参数 典型的新技能学习曲线 摘自北京大学 AI 肖睿团队团队作品 大模型参数变化三个阶段 摘自复旦大学大数据教学团队作品 智慧涌现的关键 6 通用模型( System 1 快思考模型) 推理模型( System 2 慢思考模型) 模型代表 Qwen2.5-Max 、 DeepSeek-V3 、 GPT-4o QwQ-Max-Preview 、 DeepSeek-R1 、 OpenAI-o3 运算原理 基于概率预测,通过大量数据训练来快速预测可能的答案 基于链式思维,逐步推理问题的每个步骤来得到答案 模型性能 响应速度快,适合即时任务 响应速度慢,适合复杂任务 决策能力 依赖预设算法和规则进行决策 能够自主分析情况,实时作出决策 伦理问题 作为受控工具,几乎没有伦理问题 引发自主性和控制问题的伦理讨论 优势领域 函数调用、信息抽取、文本生成、创意写作、多轮对话、复杂角色扮演、打标、开放性问题,多样性高的 任务 数学推导、逻辑分析、代码生成、复杂问题拆解,逻辑密度高的任务 提示语 需显式引导推理步骤 提示语更简洁,只需明确任务目标和需求 适用场景 (功能点粒度) • 客服场景:做话术理解与意图分类,以及简单问题的回答;且时效性要求高 • 信息打标:对每日新闻资讯中涉及到的实体(行业、公司、股票、基金等)识别,分析正负向情绪 及影响面 • 办公场景:会议助手、流程助手、公文撰写、知识问答等 • 信贷尽调报告助手:全网搜集企业多维度信息,结合审核规则、评价模型等进行推理决策,识 别风险点 • 投资研究:针对特定的政策内容或突发事件做深度解读,产出观点报告,支持决策 • 条款智能核验:把产品具体条款,对比知识库中监管和内规政策进行比对,判断是否合规,给 出整改建议 • 智能用数:支持复杂库表情况下的查询与分析作业,自助取数、经营分析 • 智能开发:需求助手、编码助手、测试助手、运维助手 7 大模型的 “快思”与 “慢想” = “ 通用” + “ 推理”模型 金融机构的大模型策略 ,应结合快思考 + 慢思考两种模式的模型 ,根据场景功能点对模型能力的要求 ,发挥不同模式模型的优 势 在人工智能语境下, “ 问行合一 ”是指一种高效的人机交互理念, 它融合了深度查询与精准执行 。 其中 ,“ 问 ”代表对未知或 复 杂问题的深度挖掘与探索, 体现了人类对知识与智慧的追求; “行 ”则代表基于 AI 分析结果的迅速且精准的行动实施, 彰显了人类 对 于机器智能输出的高效利用与转化 。 此理念倡导在 AI 技术的辅助下, 人类应持续深化提问的质量与深度, 充分利用 AI 的数据挖掘与模式识别能力, 探寻数据与知识 背 后的深层逻辑与规律 。 同时, 人类需对 AI 的输出进行精准解读, 并迅速转化为具有实际操作性的策略与行动, 以实现人机协同 的最大 化效益 。 问 探索性:“ 问 ”体现了对知识的主动探求,尤其是在使用 AI 时 ,用户通过提问来挖 掘数据 、寻找答案或解决问题。 互动性:提问是用户与 AI 系统进行交互的一种方式 ,通过提问, 用户可以引导 AI 提 供更符合需求的信息。 开放性:好的问题往往是开放性的 ,能够激发新的思考和发现,不局限于已有的知 识和观点。 行 实践性:“行 ”是将知识和信息转化为实际行动的过程, 它强调实践和应用。 目标导向:行动是为了实现特定的目标或解决问题 ,具有明确的方向性。 动态调整:行动过程中需要根据实际情况进行灵活调整 ,以达到最佳效果。 问行合一 : 主动深思 创新执行 8 • DeepSeek 发布后在 1 月 27 日迅速登顶美国下载榜首; 截 DeepSeek 在 168 个国家位居下载榜第一名。 • OpenAI 的 CEO 奥特曼承认 DeepSeek 的技术实力 , 并 表 自身模型的迭代。 • Meta 成立四个专门研究小组来分析 DeepSeek R1 的工 作 此改进其大模型 Llama 。 • 英伟达、微软 、亚马逊等国际巨头纷纷接入 DeepSeek 。 DeepSeek 颠覆出圈 , 霸榜热 议 DeepSeek R1 引 发 全 球 关 注 DeepSeek 发 展 节 点 2 0 2 3 年 7 月 D e e p S e e k 成 立 发 布 总 参 数 达 6 7 1 0 亿 的 D e e p S e e k - V 3 , 采 用 创 新 Mo E 架构和 FP8 混合精度训练, 训练成本大幅降低 发 布 新 一 代 推 理 模 型 Dee p See k- R 1 ,性 能 与 Ope nA I 的 o 1 正 式 版 持平 ,并开源 至 1 月 30 日, 示将继续加快 原理 ,并基 于 2 0 2 3 年 1 1 月 2 9 日 推 出 670 亿参数的通用大模型 D e e pSeek L L M ,包括 7 B 和 6 7 B 的 base 及 chat 版 本 2 0 2 3 年 1 1 月 2 日 首个开源代码大模型 Deep Seek Code r 发 布 ● 2 0 2 5 年 1 月 2 0 日 2 0 2 4 年 1 2 月 2 6 日 9 DeepSeek“ 国运级”产品现象 DeepSeek 之所以被称作“ 国运级”产品 ,主要是因为它在 AI 产业具有多个维度的突破性价值 :通过技术创新突破算力瓶颈、强大的功能性适配更多的 应用场景 ,低成本的优势引发各界关注 ,作为中国本土化产品驱动产业升级 技术创新破解算力瓶颈 架构创新 采用混合专家系统( MoE )架构 ,实现 “算力降维打击” ,在相同算力下支持更 大参数规模 ,显著提升模型效率。 训练优化 通过低比特 FP8 训练技术、强化学习策略 ( DeepSeek R1 完全依赖 RL 而非人工标 注数据)和通信优化 ,降低训练成本至 550 万美元 ,仅为 GPT-4 的 1/4-1/6 。 性能对标 推理能力比肩 ChatGPT 等国际顶尖模型 , 参数更少但效率更高 ,支持本地部署且响 应速度更快。 低成本优势推动普惠应用 社会各界广泛关注 游戏科学创始人冯骥等业界领袖公开赞 誉其为“国运级科技成果” , 引发广泛 关注。 主动寻求应用合作 与微信等国民级应用合作 ,通过 AI 优化 搜索推荐、 内容生态挖掘 ,展现商业化 潜力。 开源策略构建全球生态 技术民主化 全面开源并免费开放 ,吸引全球 140 国开发者参与优化 ,形成“滚 雪球式”创新网络 ,加速技术迭代。 行业应用 低成本(使用成本仅为竞品 1/3 ) 和易部署特性 ,使其迅速渗透至企 业服务、创投决策、供应链管理等 场景 ,提升行业效率。 提供科技竞争“中国方案” 打破技术封锁 突破美国在 AI 领域的技术垄断 ,降 低对海外算力依赖 ,保障数据安全 (本地部署优势)。 成本优势 训练成本远低于 Meta 的 Llama 3.1 ( 5 亿美元)等国际竞品 ,实现 “ 高性价比”技术输出 ,增强国际 竞争力。 产业升级驱动 通过 AI 能力赋能企业“重度垂直” 创新 ,助力中国在全球科技竞争中 抢占先机。 10 全部参数激活,高能耗 OpenAI 等传统模型在运行时通常需要激活全部参数, 能耗巨大 模型调整强依赖标注数据 传统方式往往需要大量标注数据来监督微调( SFT ), 耗费大量人力和时间成本,且数据标注质量也会影响 模型性能。 任务精准分配,大幅降低能耗 依靠稀疏混合专家模型( MoE )架构,仅需激活 5%-10% 的参数,将任务精准 地分 配给最相关的“专家模块” ,计算量和能耗大幅降低,如 V3 的训练成本仅为 GPT-4 的千分之一。 自主试错优化 R1 采用纯强化学习( RL )训练,跳过 SFT ,让模型通过自主试错和优化来学习, 减少对标注数据依赖,降低训练复杂度。 在实际应用中, R1 在数学和编程任务中表现优于 OpenAI o1 。 自适应调整 极简单的奖励规则,让大模型自我博弈、不断顿悟与自适应调整,实现深度思 考。比如, R1 会深入思考多种解题路径,评估优劣后选择数学难题的最优解, 这种能力使其在处理复杂任务时更加高效精准。 挖掘硬件潜力提高算力利用 在推理时, DeepSeek 采用多 Token 预测( MTP )技术,实现一次性生成多个 单词。 该技术可同时处理多个句子片段,显著提升长文撰写的写作效率,在处 理大量 文本生成任务时,速度优势明显。 数据信息高效处理 DeepSeek 的多头潜在注意力( MLA )机制通过对注意力机制中的键值进行压 缩实 现数据高效处理,这就好比仅通过阅读摘要就能快速了解长篇书籍的核心内 容。 奖励学习机制高度依赖 其他大模型对复杂神经网络奖励、监督学习以及学习 示例的高度依赖 逐个单词生成答复 信息冗余处理 传统模型计算注意力权重时,可能会对不重要信息分 配过多资源,导致信息冗余。 训练成本低 深度思考强 推理速度快 处理效率高 训练流程优 11 训练 成本 深度 思考 推理 速度 数据 处理 训练 流程 DeepSeek 优势 传统模型 DeepSeek 01 公司简介 02 大模型 技术探索 大模型 实践应用 目 录 03 12 人保人工智能架构 2023 年 , 围绕人工智能大模型技术的应用实践 ,人保打造了从算力、平台、模型、产品到应用“五位一体”的人工智能大模型解决方案 ,构建安全可 控的人工智能大模型生态 ,入选 2023 年“金融电子化年度十大事件” 人保大模型生态 2023 年 ,人保寿险构建了以通用大模型为基础、 自研垂直领域大模型为主体、外部大模型能力为辅助的人保大模型生态。包括五大 AI 核心组件及专业 领 域 AI 子模型体系 ,打通大模型从技术研发到场景应用落地的最后一道关卡 14 人保聚焦以 DeepSeek 为代表的大模型 ,夯实寿险大模型基础建设 ,深度挖掘高价值应用场景 , 赋能外勤销售、 助力内勤经营 管理 人保 DeepSeek 场景应用布局 算 CPU GPU AI 芯片 L. 以太网 RoCE TCP HDD HHD SSD 力 报告生成 制度问答 会议纪要 智能写作 文档对比 指标问答 数据模型 业绩分析 指标分析 ChatBI 通用大模型 专业大模型 领域大模型 AI 算法库 训练引擎 推理引 擎 异构计算 高速网络 多元存储 DeepSeek 大模型应用规划 个人群业务 新人入司效率提升 应用 场 景 示例 图数据库 向量数据 库 ... 多源数据 线上触客效率 客户分析 队伍分析 承保风险评估 理赔案件智能审核 合规问答 核保智能决策 反洗钱报告 合规预警 小额理赔案件快赔 制度体检 业绩分析 承保理赔 承保预审核 工作流服务 ( Workflow ) 合规风控 合规核验 AI 开发平 台 ( Dify ) 多轮对话服务 Chatflow 工具类 ( API 、爬虫、 搜索 ... ) 智能体服务 ( Agent ) 异构数据 服务 层 模型 层 检索增强搜索 ( RAG ) 集团统一智能平台 结构化 非结构化 数据分析 智慧办公 数 据 知识库 15 u nnb ... ... 人保大模型 AI 平台支撑 搭建 AI 应用平台,实现智能体的快速上线,即使是非技术人员,也能参与到 AI 应用的定义和数据运营过程中 功能扩展 支持插件开发与 api 集成,允许 对 接外部业务系统或新增功能模 块 兼容多种 LLM ,平台已对接通义千问、 deepseek 等 大模型,模型支持在不断扩展中。支持系统推理模 型 、 Embedding 模 型 、 Rerank 模 型 等 模 型 。 RAG 引擎与知识库 支持 PDF 、 TXT 等文档的文本提取,结合向 量数 据库或全文索引构建知识库,提升生成内容的 准确性和相关性。内置数据集管理功能,支持 数据清洗 标注及增强 低代码开发 自 行 编 排 chatFlow 、 workFlow , 节 点可直 接在界面拖拽组合,交互友 好易上 手。 大模型接入 兼容多种大模型,平台已部署 通义千问、 deepseek 等大模型, 模型支持在不 断扩展中。 提 供 应 用 日 志 监 控 、 性 能 分 析 及 用 户 行 为 跟 踪 , 支 持 通 过 生 产 数 据 优 化 P ro m pt , 可 视 化 面 板 查 看 API 调 用 情 况 知识库(如产品知识库) 、内容生成(话术 / 文案) 、业务流程(如理赔 数 据采集) 、多轮问答(如智能客服) 、智能体(如核保助手、销售助 手) 可 直 接 发 布 应 用 / 工 具 , 支 持 两 种 接 入 方 式 : 1 、 直 接 页面嵌入。 2 、 restful api 调 用 直 接 在 平 台 使 用 可 视 化 界 面 开 发 、 调 试 、 预览应用 提供图形化界面,可直接上手搭 建聊天助手、工作流、智能体。 开箱即用 AI 应用平 台 核心能 力 监 控 应 用 快速部署 AI 原子能力 多模型支持与集成 典型应用场景 全流程支持 可视化编排 构 建 应 用 发 布 应 用 16 角色 大模型(如 DeepSeek ) 小模型(垂直场景微调) 定位 复杂决策、跨域推理、创意生成 高频执行、实时响应、资源节约 典型场景 保险方案定制 跨部门风控分析 客服意图识别 表单自动填写 资源消耗 高算力、周期性调用 低延时、 7x24 小时运行 数据反馈 接收小模型汇总的增量数据用于迭 代 收集用户行为数据上传至大模型 人保大模型建设思路 通过大小模型动态分工 ,大模型赋能小模型通用能力 ,小模型助力大模型实现专项任务执行 ,大小模型双向协同完成业务闭环。 小模型 (执行 / 交互) 大模型 (深度推理) 小模型 (实时响应) 大小模型协同方案 复杂任务路由 结果反馈 用户请求 17 人保大模型应用实践 - AI 保宝 近两年,人保寿险建设“ AI 保宝”大模型平台项目,引进生成式大语言模型,面向保司内勤、外勤两大群体,切实解决在办公 保司 内勤 保司 外勤 知识问答、合同审核对比、 文案 / 海报生成等 坐席话术推荐、产品 咨询服务等 产品条款、投保规则、保单 贷款等解答 管理岗位、作业 岗位、 IT 岗位等 电话客服、电商 客服、营销员等 2023 年 2023 年 - 至今 2024 年 2024 年 2025 年 助手、坐席问答、产品咨询等场景中的业务痛点 合同助手、绘图等 功能上线 项目立项启动 项目迭代开发 百问百答上线 业务场景扩展 办公 助手 产品 宝典 坐席 助手 + 1 个大模型平 台 + 3 大创新场 景 2 大用户群 体 》 18 AI 保宝 -- 百问百答 ( 一 ) 百问百答: AI 保宝在个系统触面接入上线,知识涵盖公司规章制度、产品条款、电商话术推荐、财务费控等多场景,线 上 调用量超 26 万,问答实现秒级响应 行业影响力 • 外部权威奖项: 中国保险科技创新大赛、 中 国技术力量 AIGC 先锋榜、 2024 保险业 数字化 转型案例、 infoQ 中国技术力量年 度榜、等 11 项权威奖项 • 专利申请: 申请 12 项相关专利, 目前已通 过 专利局初审。 • 外部发声: FCon 全球金融科技大会 2024 、 中 国保险业数字化与人工智能发展 大会、讯飞 星火 4.0 发布会等 9 次外部发声。 • 业务场景:制度问答、会议纪要、智能报表、智 能 建课、群助理机器人、营销文案 11 个场景。 • 线上触面:人保 e 办、人保 E 通、费控系统、企 业微 信、办公门户、 e 掌柜、核心系统运维机器 人、智 能陪练、双录、 OA 等 11 个系统
| ||
下载文档到本地,方便使用
共 33 页, 还有
1 页可预览,
继续阅读
文档评分


基于多模态大模型的电力现场安监管控研究及实践