ppt文档 电力人工智能多模态大模型创新技术及应用方案(35页 PPT) VIP文档

7.61 MB 35 页 21 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
电力人工智能多模态大模型 创新技术与应用 1 、研究背景 2 、关键技术 3 、应用案例 4 、未来展望 目 录 人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科 学;其在历史上经过多个发展时期,形成了不同的技术流派; 深度学习是目前主流。 1950s—1970s 1970s 中期 1980s-2000s 早期 2000s-2010s 2010s-2018s 2018s- 现在 推理期 知识期 统计学习时期 集成方法时期 早期神经网络时期 大模型时期 人工智能领域迭代迅速、多种技术流派蓬勃发展,在多个领域已有广泛应用。 背景 1—— 人工智能的概念及发 展 依赖统计学和人工 设计特征构造算法; 代表算法: 支持向量机 (SVM) 决策树 朴素贝叶斯算法 神经网络在多个领 域取得初步应用; 代表算法: 卷积神经网络 循环神经网络 图神经网络 聚焦知识工程 与专家系统构建, 通过人工整理知 识库驱动决策, 受限于知识获取 成本与规模瓶颈。 以符号逻辑为 核心,依赖人工 规则与推理系统 ( 如 专家系统 ), 强解 释性但泛化 能力 弱。 基于海量数据与 大规模预训练; 代表算法: DeepSeek 系列 Qwen 系列 GPT 系列 通过模型组合提升 预测精度; 代表算法: 随机森林 梯度提升决策树 神经网络 ) 深度学习机器学习人工智 能 4/37 在人工智能领域,数据、算力与算法构成发展基石——数据驱动模型训练,算力支撑复杂计算,算法优化 技术路径,三者协同推动人工智能向更高阶形态演进。 有监督数据 人工搜集、标注 成本高昂、扩展性差 图像分类 目标检测 .* 芯 片 英伟达 GPU 华为昇腾 谷歌 TPU 海光 DCU AMD 芯片 寒武纪 MLU 单任务模型 CNN SVM RNN 决策树 LSTM GNN 合成数据 利用模型、仿真生成 虚拟现实 自动驾驶 生态 PyTorch TensorFlow MindScope 训练算法 无监督预训练 强化学习 前沿探索阶段 底层计算库: CUDA 、 CANN( 华为 ) 有监督微调 对比学习 * 互联网爬取、规模大 LLM 预训练 多维并行算法 状态监测、任务调度 语言通用模型: DeepSeek-R1 等 无监督数据 图像生成 集 群 通用模型 无需人类专家标注 高效互联通讯: NVLINK 、 HCCL ( 华为 ) 多模态通用模型: Qwen2-VL 等 . 背景 1—— 人工智能的概念及发 展 数据 算力 算法 英伟达仍然是最主流的算力平台; 国产算力平台快速崛起,生态逐渐成熟。 通用模型是当下研究热点与未来趋势; 研究高效训练算法具有重要创新意义。 如何提高数据的规模与质量 是当前人工智能领域的关键问题。 5/37 早期的深度学习受限于计算能力和数据规模,难以发挥优势。随后多层感知机与卷积神经网络结合反向传 播算法,显著提升了模型的学习能力。随后,基于注意力机制的 Transformer 架构改变了自然语言处理 的范式,使大规模预训练成为可能。近年来,大模型凭借超大规模参数和海量数据学习,在多模态学习、 推理和通用人工智能方向取得重要进展,为人工智能的发展开启了新的阶段。 大模型 模态扩展 文本 检索增强 图像 / 视频 大规模基础模型 音频 电力大模型 医疗大模型。 Transformer 架构 注意力机制 多模态融合 0upr ake Wefert FFIN Bock Lsyer Nom or llock Po non Embodang ◎ Maskod SetAonlon hput Toke Wcan Layer Nom 序列处理 高效并行 模态扩展√ lon iugar DY peratiam u 背景 1—— 人工智能的概念及发 展 多 层 感 知 机 卷 积 神 经 网 络 经典神经网络 能力扩展 Alagenti 金融大模型 行 业 应 用 工具学习 6/37 大模型井喷式发展 自 从 ChatGPT 在 2022 年问世以来 ,全球大模型发展迅速,百种大模型竞相发布,推动性能、规模和应 用 的全面突破,成为科技进步的重要动力源。 Al 主播小雨 HTV 机州新回联 2024,2.10 行业应用赋能层 Q 搜 索 叩对话 推 荐 + 医 疗 仙 遥 感 基科学 方 元 宇 宙 基础算法平台层 计 算 机 视 觉 自 然 语 言 处 理 多 模 态 开 发 平 台 算法框架 底层服务支撑层 回芯片 数 据 服 务 T5 2019 Codex Gopher( GLM WeLM Sparrow NLLB mT5 2021 InstructGPT MT-NLG OPT ∞ LaMDAC PanGu-α Ernie 3.0 2022 mTO 0 ∞0 Galatica Uni-Perceiver V2 Nemotron-4-340B Claude3.5Sonnet Grok-2 DepSeek-v3 Chude with 本课题组工作 Mistral Small3 03-mini Deep Research Qwem2.5-Max Janus-Pro Operator Step-1oVision DeepSek—RI UL2 YaLM GFLAN-T5 FLAN-PaLM ChatGPT x UaMA 些 PanGu-2 InternLM Baichuan PaLM2 CodeGen2 LLaMA2 l Baichuan2 Aquila2 Skywork XVERSE phi-314B 0 Lama 3-70B Cauks30mX Geminil.5 GPT4⑤ 多 模 态 运 维 安 全 助 手 多 模 态 电 力 设 备 状 态 感 知 助 手 大 模 型 发 展 历 程 图 背景 2—— 人工智能大模型引领新 一 FLAN Uni-Pereiver Uni-Pereiver-MoE AlphaCode 轮科技革命 2025 电力时序数据分析监测模型 电力专家与客服系统 豆 开 源 社 区 大 模 型 测 评 城 市 ⑤ 传统电网:传统电力系统人工依赖度高,存在资源配置低效和故障响应不及时等问题。 新型电网:人工智能赋能后,通过实时调度优化、智能维护和精确能源管理,可大幅提升电网的运行效 率、稳定性与可持续性。 新型电网 发电智能调度 & 输电网络优化损 耗 低 配电灵活管控 & 变电精准检修 响应快 用户负荷预测 & 用电科学管理体 验 佳 加 二 多项针对人工智能的专项政策出台 国家发展和改革委员会 National Development and Reform commission 工业和法息化部中央同造安全和信息化委民会办公室国家发展阳边革委员会国家标准化 管理要员会关于印发国家人工新能产业 始 合标准化体系建设摇南 (2024) 的通知 nr i 人 dany 民 and o 和 p e 部 国务院常务会议研究部署推动人工智 传统电网 电力生产和分配相对低效 × 人工监控与巡检 成本较高 设备故障响应 全天候实时响应差 × 借助人工智能赋能新型电力系统可持续蓬勃发展 背景 3—— 人工智能赋能新型电力系统发 展 中华人民共和国中央人民政府 ww. govco 中 华 人 民 共 和 国 国民 经 济 和 社 会 发 展 第 十 四个五年规划和 2 0 3 5 年 远 景 目 标 婀 要 第 四 章 强 化 国 家 战 略 科 技 力 量 专祖 2 科技前造健城破炎 01 新一代人三智热 首语买地理论典顿,专用鹉所明文,深度季河都血事开深算出平业物进, 罗推理物决策,医住图形,备银想,自然译食识前死理等领城创新 能贴 第三条 定 期梳 理 好风险识 控制、风 握 和化 解 电 力 系 统 现 状 电 力 系 统 发 展 8/42 从数据上讲,通用数据分布与电力领域多模态数据差异过大,专业程度低、关联性弱; 从模型上讲,开源通用模型缺乏电力专业预训练 ( 缺乏专业电力知识注入 ) , 多模态支持不足; 从 应用上讲,现有国产化电力大模型在真实电力任务上性能不够高、与实际需求仍存在差距。 模型角度 开源训练数据 开源部分代码 开源部分权重 × 模型趋于闭源化 开源通用模型 无 法 原 生 支 持 C i Gasdiscrimination 电气信号 红外图像 气体组分 分 布 差 异 大 × 电力负荷曲线图 设备故障诊断图 电力数据 差异巨大、 无法使用 通用数据 现有的数据类型 关联性差 曲 H 委 通用大模型 精 准 性 差 可 靠 性 不 足 图 像 数 据 分 析 偏 差 现有单任务算法模型 可靠性不足 标注位置 目标检到模型训练 视师的据 图片、处理 标 注 文 本 文 字 识 别 模 型 练 电力复杂场景下数据的智能识别方法 电力安全是国家安全问题,电力人工智能多模态大模型核心技术必须自主可控 9/37 背景 4—— 自研电力大模型意义重 大 数据角度 应用角度 专 业 程 度 低 × 闭 源 化 不 支 持 多 模 态 文 本 数 据 理 解 有 误 GPT-2 × 背景 4—— 自研电力大模型意义重大 ( 数据 层 面 ) 文本数据 电气信号 图像与视频 研发 电力通用大模型开发需要大规模、高质量、多维度的数据集 数据构建难度大 电力数据获取难度高、质量 差 异大、覆盖模态多,因而数 据 集构建难度大 与通用数据差异大 模型训练数据与电力任务场 景数据差异大;难以直接 应 用于电力场景模型训练 需要支持复杂工况下智能模型的多模态、 多维度综合协同处理 电力行业 需要具备 高质量、多场景覆盖、 多模态、多维度集成的数据集 需求 痛点 1.8 电描,温象比是 B7 备自检装置,温泉 路合上 aV 德 无,温村站彩开目 v 得程 399 开,盈人连利站 1 备自改能置 -…… 2.siavk 新乙成负靶用口 aV 以新平线供电, 1 移 电 新 . 发 市 v 也网风除,发 6 V 品题 .1i8V 从面平战为重要设备 4. 工结来后 . 者口使复 iaV 从面甲乙拨 供电,其它方式哲不性量 现状 10 /37 传统电力 AI 模型基于特定任务开发,大多为单模态算法,综合成本高、智能性与泛化性不足; 开源 AI 大模型缺少电力领域预训练,专业知识缺失,处理实际电力任务能力差。 输电线路运维目标检测算法 隔离开关状态监测实例分割算法 SVM 故障分类算法 缺乏行业数据 缺少专业知识 要根据任务场 景定制开发和 训练对应的模 型 ,成本高昂 处理多模态数据 能力较差,无法 处理多场景结合 的复杂任务 智能性不足, 无法根据用户 指令给出对应 的专业 回 答 背景 4—— 自研电力大模型意义重大 ( 模型层 面 ) 传 统 模 型 开 源 大 模 型 必 须 自 造 电 力 A 多 模 态 大 模 型 m mE 任务适应性差 用 期 * 自 对话地 泛 化 性 不 足 适 配 性 差 电力设备运维专家问答算法 驴 世速且 忙 ca 11737 s ou 面向电力场景的大模型边缘计算技术开发 大量电力设备终端互联 更高的数据安全要求 场景边缘 计算要求 多种传感器数据协同处理 更快的响应要求 要求 电力大模型推理加速技术 技术体系 国产边缘计算设备推理框架 基于国产计算设备的电力大模型训练技术开发 HYGON 国产计算 设备 海 光 DCU 华为昇腾 天数智芯 应用要求 数据模态多 任务形式多样 专业性要求高 要求 基于国产计算设备与电力大模型应用要求开发针对性的高效训练算法 电力通用大模型的开发需要基于国产计算集群开展软硬件协同优化,满足电力大模型的应用要求; 电力场景需要基于边缘计算的大模型部署方法,亟需开发相应的应用技术。 开发基于国产硬件设备搭建电力大模型应用体系 12/42 背景 4—— 自研电力大模型意义重大 ( 应用层 面 ) 真实电力场景部署应用 电力大模型轻量化技术 电力大模型 电力设备 关键技术实现 13/3 书 籍 1. 数据采集 </> 网 页 公开数据 现场数据 图像描述生成 检测数据增强 2. 数据清洗 特殊符号过滤 图像裁剪过滤 3. 数 据 生 成 自动化生成 多样化问答数据 提供 训练 数据 目标 技 术 体 系 特 征 关 系 保 留 的 知 识 蒸 馏 方 案 目 技 标 蒸馏模型知识 减少信息损失 知识空同映射 特征关系保留 梯度 精度 分析 的模 型量 化技 术 目 技 标 解决传统量化缺陷 保持模型性解 梯度精蜜分析量化 量化增量训练 边 缘 计 算 + 云 边 协 同 目 技 标 术 高效模型部署 云边一体高效协作 硬件算子优化 统一数据网关 文 本 训 练 模 态 训练 纯 文 本 数 据 多 模 态 数 据 Transformer 架 构 白回归预测 高效率压缩 统一端:解码架构 统一预训练框架 电力通用任务 布 式 并 行 训练 提 供电 力多模 态 基 础 模 型 模型并行 流水线并行 支持分布式并行训练 后训练:能力增强与偏好对齐 指令微调技术 人类反馈强化学习 多模态统一编码 关键特征抽取 图保始码算法 动态分辨率 视须关睫帧态知 多场景协间增强 真实龄据感知 电气信号始码 高雌特征映射 电气词表扩充 提 供 统 一 的 多 模 态数 据 表 示 基 础 算 子 基座 能力扩展 注意力机制 深层特征提取 自研高性能电力大语言模型 电力大模型全流程关键技术体系 1 数据生成:大规模高质量电力专业数据集构建 3 模型训练:电力大模型分布式训练关键技 术 预训练:基础模型能力训练 支 持 分 混合立体并行训练方案 2 模型构建:电力通用大模型研发 多模态数据统一编码器 电力通用大模型 4 部署应用:电力大模型轻量化与边缘计算部 署 实 时 交 互 模 块 检 素 增 强 模 块 工 具 调 用 模 块 模 态 对 齐 模 块 - 提供 部署 模型 提供模型 数据去重 敏感词去除 有兹督训练 人类偏好对齐 人类评估 反馈优化 数据井行 张量井行 纯 预 多 预 专家编写 14/37 术 技 系 体 术 系 技 体 · 关键词过滤 · 语种过滤 · 句段层面 · 文档层面 · 移除含身份信 息数据 .. 指 令 微 调 数 据 集 制 作 调整自动标注策略 为下游任务提供场景丰富、任务多样的高质量指令数据 预训练语料库制作 大规模、自动化的语料筛选清洗管线 为预训练提供充足的专业领域知识注入 原始数据搜集 质量过滤 去重 隐私保护 MD A. MD1 B. MD 1 、数据生成:纯文本数据制作管 线 构建高效的 半自动化数据制作管线,为预训练和下游任务微调提供大规模、高质量的电力领域文本数据支
下载文档到本地,方便使用
共 35 页, 还有 8 页可预览, 继续阅读
文档评分
请文明评论,理性发言.