ppt文档 智慧电力大数据平台方案

10.61 MB 64 页 0 下载 15 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
大数据平台产品架构 全面透视大数据平台的架构、能力与价值 2 大数据应用生命周期 大数据可视化 大数据分析计算处理 大数据存储 数据获取和治理 数据源(管理、交易、事务、传感、监控、文件……) 数据驱动决策 数据提供服务 3 大数据生态湖泊 据 数据运维 数据之源 数据生产区(原始数据) 结构化数据 文本文件 多媒体数据 描述类数据 知识展现区 知识交互区 大数据可视化 知识发现区 数据台账 信息发现区 ODS 数据多维报表 关键索引 数据魔方 大数据操纵 知识挖掘区 大数据挖掘 多维数据关联 数据 APIS 行业规则 主数据 机构内部数据 互联网数据 社会数据 数据审计 数据安全 数据质量管理 主数据管理 元数据管理 数据标准 数据治理流程 元数据 基于大数据的应用体系 大数据检索 大数据关联 大数据分析 大数据预测 数 数 据 知 知 识 识 信 信 息 息 应 用 4 电力大数据概述 发电 输电 配电 售电 特性一:不可存储能源 电力是不可存储的能源, 一旦生产则必须耗用, 这就注定了电力生产、 使用、销售的独特性。 特性二:垄断性 电力的大型基建特性注 定了电力行业的垄断性, 国家电网和南方电网公 司是目前国内企业体量 最大的存在。 特性三:关注社会效益 作为基础存在的电力供 应是国计民生的大事, 即便作为企业,也是将 社会效益看重于经济效 益的存在。 特性四:新机遇挑战 伴随着国家电网总经理 刘振亚离职,以及国务 院 2015 九号文的颁布, 新的变化与机遇开始出 现。 国务院关于印发电力体制改革 方案的通知【国发 [2002]5 号】 中国华能集团公司( 217 ) 中国大唐集团公司( 376 ) 中国南方电网 ( 18 ) 中国电力投资集团公司( 408 ) 中国国家电网 ( 2 ) 中国电力建设集团有限公司 ( 200 ) 中国能源建设集团有限公司 ( 309 ) 国务院关于印发电力体制改革 方案的通知【国发 [2015]9 号】 中国华电集团公司( 345 ) 中国国电集团公司( 299 ) 5 电力大数据 —— 电力相关企业信息化分析 国家电网信息化建设路径 SG-186 SG-ERP 一平台 一系统 多场景 微应用 2006-2010 一体化企业级信息集成平台 八大业务应用 六个信息化保障体系 2011-2015 建立覆盖面更广,集成度更深,智 能化更高,安全性更强,可视化更 优的新型 IT 架构 , 纳入了电力应用 的全过程,在数据集采基础上加强 数据分析和辅助决策的功能 2016-2020 国网拆分背景,去 SOA ( SAP 、 Oracle 、 Accenture )化需求,对 过去大系统建设的反思和调整。强 调自身 UAP 平台的应用。 国家电网信息化建设套路 业务部门提报 可行性研究报告  国网直属型单位  国网紧密型单位  甲方代写     相关管理部门 进行初审 单位所属信息化科室 国家电网经济研究院 国家电网信通部门 电科院信息安全部门 6 电力大数据 —— 整体框架 宏观 大数据 外部 大数据  电网改革的决策支撑;  能源结构的调整改善;  基于多维视角的决策分析;  提供日常建设、运维的监管;  实现对最末端消费的数据采集分析;  对关联上下游产业提供战略性指导;  改造提升经济效益目标的营销管理;  配合国家产业调整目标,协助供给侧改 造的实现 7 电力大数据 —— 细节关注内容 售电 配电 输电 发电 今后工作的 重中之重 分割后的 新领域 传统领域 的新突破 急需支撑的 先锋领域 售电业务全面开放后,对售电、购电的内容都将 产生天翻地覆的变化,迫切地需要大数据支持今 后业务的方向与决策支撑,可以预见基于电信客 户忠诚度、银行客户营销、电商策略支撑方面的 大数据应用将会得到大规模应用。 配电业务在今后将会一分为二,特高压高压配电 继续由传统电网公司负责,高低压配电建设则可 能由新诞生的售电公司负责,老树新花将会为配 电建设工作带来新的活力。 输电业务将会继续由电网公司负责,但是目前的 用电发电端同时开放以后,输电关联的业务将会 不可避免地带来影响,电网将会放下自身“老大” 的地位,输电将会变更其经济效益和社会效益的 权重,更多地“迁就”社会实际需要。 国家开放了个人发电销售业务以后,出现了围观 冷场的情况,如何让发电销售说服大众和电网公 司,成为国家一个新的创业增长点,再没有比大 数据更具说服力的科学依据了。                     用电客户市场细分模型 高价值工业用电客户分析模型 居民用电忠诚度分析 耗能电器用户画像 节能智能家电推荐 用电高峰时段区域分析 变电站选址分析模型 变电站建设舆情监控 变电站检修项目风险监控 变电站分时段负载分析及关联分析 配电设备传感巡检数据分析及故障率 分析 输电线路规划分析模型 输电线路环境影响及自然灾害评估 输电负载分析管理 输电线路建设资源预测模型 输电建设承运商 / 承建商等级评估 单体发电质量分布分析 单体发电输配成本核算 单体发电定价决策依据分析 临时性用电高峰单体发电支持体系 8 电力大数据 —— 宏观关注内容 作为现代工业真正的神经,社会正常运转的基本资源,国家一直十分关注电力与工农业、 城市发展的关系,不管是特高压的论证审批,还是国家电网的拆分,以及水电站建设等各 个方面应用,大数据将会为宏观决策提供科学的数据支撑和高效的分析模型。  水电站选址论证  火电站环境污染分析  风力发电质量与气象分析  远程输电时段地域成本论证  用电调度能效评估  输电建设资源预测系统  变电站覆盖区域负荷分析  重点工业园区用电支撑调度 平台  用电量与环保关联性分析  电量 GDP 关联分析  用电区域分布引导管理  核电站运转情况分析  电站持续型环境影响评估  重大灾害电站应急指挥平台  统一电价及电力营销行为分 析  电力巡检模型分析  大型活动临时配电调度管理  变电站故障及处理平台  智能巡检机器人数据管理  错峰用电定价指导分析  异常灾害电力负载应急管理  电价舆情分析 9 电力大数据 —— 城市耗电量分析 通过收集不同气候、不同时段期间以及其他关联 的用电量情况,助力“智慧城市”应用的同时, 有效预测用电需求,协助电力相关单位应对用电 高峰期的电力调度和资源确保能力。 10 电力大数据 —— 雅砻江流域水电开发有限公司大数据案例分享(成果展示) 基于 3*12 的大屏展示以下内容:电站发电生产数据、水文气象观测数据、日常 KPI 指标、视频监控数据 11 电力大数据 —— 四川电力物资公司典型建设 配送资源 物资调度 中心 调度大厅建设 在途信息集成 监控信息集成 传感信息集成 视频传输集成 GPS 信息集成 采购部门 合同招标管理 需求预测管理 平衡利库管理 财务部门 仓库 物流设备集成 库位规划集成 仓库物流规划 辅助决策 现场收发货 入库管理 出库管理 库内管理 资金支付深化 财务结算 财物一体化 1+23+84 仓储网络布局图 12 电力大数据 —— 物资需求模型应用 13 行业大数据应用面对的挑战 硬件无法跟进 数据规模的 指数级增长 过于分散和原 始成为大数据 应用的障碍 复杂数据算法 与业务模型 衔接 诸多大数据并 行计算架构的 选择 大数据应用实 现路径: 从哪里开始? 专业人才匮乏 14 CONTENT 1 2 大数据 应 用生 态 大数据平台 数据共享开放与服务 元 数 据 管 理 数据台账 数 据 治 理 流 程 主数据 数据目录 数据审计 数据安全 数据质量 数据标准 大数据门户展示 移动数据可视化应用 敏捷 BI 可视化大屏 大屏显示控制模板 15 Data Discovery Family 大数据交换汇 集平台 大数据存储 大数据治理平台 大数据 主题应用 大数据 可视化 平台 大数据智 能运维平 台 原生态 数据烟囱 原始 RDB 原始 FILE 流媒体 数据 互联网 数据 分布式 RDB HDFS 流计算 并行批处理 Map/Reduce 资源 监控 系统 智能 部署 系统 政务 大数据 经济 大数据 财税 大数据 民生 大数据 旅游 大数据 数据适配框架 ETL 数据转换 爬虫软件 数据清洗比对 数据迁移 数据处理流程 实时采集 文件 数据库 MPP 数据库 RDB 图 数据库 键值 数据库 列式 数据库 Spark 其他 Hadoop 生态 政法 大数据 DAC 数据总线 实时分析 环保 工业 商用 大数据 大数据 大数据 大数据 知识认知 平台 Hadoop 运维管理 机器学习 大数据应用驾驶舱 大数据应用 智能调度 大数据基础架构 大数据应用 门户系统 算法库 管理 模型 设计 大数据智能分析平台 模型 模型 模型 训练 发布 管理 选矿 捡矿 洗矿 储运 冶炼 成型 铸模 16 大数据交换汇集平台 构造大数据的数据之源 17 大数据交换汇集平台核心价值 开发环境 用直观且以角色为基础的图 形用户界面,管理数据处理, 提供拖拽功能,源系统访问 和可自定义的元数据树 互联互通 相较于其它解决方案, WYDC 数据管理能够实时或批量地在 更多的平台上链接更多数据源 集成设计 用可视化端到端的事件 设计器,建立和编辑数 据管理流程 消息队列 通过基于消息的连接整 合异步业务流程 ETL 抽取、转换、加载,通过开箱即 用的基于 SQL 的数据转换功能支 持 ELT ,获得更高的灵活性 管理与监控 跟踪作业状态和性能报告 以及趋势信息的各项指标 数据联合 获得虚拟访问多种数据库结 构、企业应用、主机遗留旧 文件、文本、 XML 、消息队 列和其它源的功能 迁移与同步 可以在多种数据库、企业应用、 主机遗留旧文件、文本、 XML 、 消息队列以及其它源之间,进 行数据的迁移和同步 . 18 ETL 概述 数 据 源 输 出 数据库 结构化数据 其它数据 加载 加工 清洗 抽取 数据库 数据仓库 其它数据 更多类型的数据来源 支持各种数据源,包括 DB2 、 Oracle 、 Mysql 等各种主流数据库,以及结构化文件系 统、 Excel 、 Xml 、 LDAP 、 SOAP/WebServcie 、 CSV 文件和 RSS 等各种数据源。 更广泛的连接方式 数据库连接支持集群,和数据库分区访问。数据库连接的方式支持 JDBC 、 ODBC 和 JNDI 方式,提供了数据连接池功能,能够大大提高数据库的访问效率。 更人性化的控制方式 提供了图形化界面的操作方式,开发人员只需拖动相应的组件到控制台即可。 更强大的性能和处理速度 采用并行处理的方式实现数据的高效处理,支持 10 G以内的大数据量的数据采集, 并在网络断开后重新执行任务时,支持断点续传功能。 E T L 19 ETL 服务器 认证授权 监 控 管 理 接 口 扩 展 接 口 ETL 资源库 数据 资源库 文件 资源库 ETL 核心架构 集成开发工具 数据源接入 流程开发 任务配置 任务部署 调试跟踪 任务执行 监控输出 运行日志 统一管理平台 运行控制 状态监控 日志查看 权限管理 节点管理 错误告警 性能统计 面板定制 处理流程 转换引擎 转换 组件 元数据 适配器 组件 ETL 引擎 任务调度 转换 流程 流程 控制 性能管理 任务引擎 操作 控制 交换管理 任务 调度 20 丰富的 ETL 构件库 四方 ETL 产品同类 ETL 产品 主机配置 曙光 640 AMD6136*2(x8)2.4GHZ 4G*16 SASST91000640SS1T*12 曙光 A-620r-G AMD6136*2(x8)2.4GHZ 4G*16 SASST91000640SS1T*12 DataNode 数量 5 台 67 台 每天数据处理量 1T 8T 数据处理时间 9 小时 17.5 小时 单服务器计算能力 22.756G/ 小时 6.987G/ 小时 对比结论 ETL 产品数据计算能力是同类 ETL 产品数据计算能力的 3.257 倍 21 强大的处理性能 22 交换汇集平台特性 为 数据集成 、 数据整合 、 数据中 心建设 、基于 复杂数据流 的数据 处理提供稳定高效的技术支撑 相关界面及效果 23 提高开发效率缩短周期  图形化界面创建数据采集转换、抽取、清洗作业;  支持智能采集; 丰富的数据交换功能  支持多种数据库、实时接口及库表交换、文件交换;  支持全量、增量方式的数据捕捉方式; 实现复杂数据处理  零编码的数据处理产品 ;  零编码图形化拖拽方式,完成数据抽取、转化、清洗设计; 支持多种存储架构  支持 hadoop 、 Mpp 、传统数仓 多层次安全机制保障  支持分级分域授权、三员分离;  支持通道安全,支持 SSL 传输通道加密功能;  支持数据加密,支持国密算法;  支持交换全过程监控、审计,并提供邮件、短信预警功能; 24 网络爬虫功能概述 网络爬虫是一个集成在数据模块下的自动下载网页的程序,它根据既定的抓取目标,有选择的访问网页与相关的链接, 获取所需要的信息,无需安装任何软件,挖掘互联网数据、配置规则简单(支持循环翻页、集合、点击事件、模拟账号登录)支 持分布式采集、定时循环采集、有效的防范 IP 被封,支持采集数据导出,并且能够对接各种主流存储结构的面向主题爬虫。 25 网络爬虫特点一览 更简单的 规则设置 支持异步 AJAX 简单配置出各种复杂的爬虫规则, 大大缩短了脚本编写时间,而且 更高效和更准确。 支持鼠标点击事件(页面不跳转) 的数据回调获取。 分布式 抓取 利用 nginx 实现分布式抓取,提高 爬取效率。 多线程 爬取 反监控 单个节点采用多线程抓取(线程 数量可配置)配合分布式部署抓 取效率进一步提高。 采用 IP 代理的模块,和一些反监 控配置,能有效的确保爬虫平台 IP 被网站封的可能性降低。 分布式 监管系统 能够实时监控各个节点上爬虫服 务器的运行情况,并能够及时统 计和发送异常信息给异常处理模 块。 26 网络爬虫界面效果 先进标准的 SOA 架构 标准化技术架构 规范化管理框架 构件化业务模型 高效灵活的开发体系 方法论和最佳实践 一体化可视工具平台 组件化和图形化 业务化的配置开发能力 自动化流程表单设计 灵活的业务权限 丰富的构件库 27 大数据应用驾驶舱 大数据高速飞行的驾驶舱 28 大数据应用驾驶舱 全方位的 辅助分析能力 更低的 建设成本 全景 统一管理 可信赖的 安全控制 超强的 计算能力 更低的 建模门槛 29 大数据应用驾驶舱 30 大数据治理平台 大数据治理实现数据内升 31 大数据治理的延伸 治理流程 原始 数据 元数据 数 据 标 准 字 典 行 业 业 务 规 则 数据接口 共享开放 数 据 检 索 数 据 服 务 32 大数据治理平台核心价值 全景化信息 开放与检索 更全面的数据 质量保障 全过程 信息安全  提供数据标准梳理工具,使得元数据更合规  支持策略集的质量巡检方式,保障数据的完整性  支持主题的数据台账,  基于元数据的信息管理,提供数据资源目录与导航  多渠道的数据访问机制(目录、 API 、 Webservices ) 支持交换全过程监控、审计,并提供邮件、短信预 警功能基于 oAuth 协议的第三方单点登陆集成的模块 支持通道安全,支持 SSL 传输通道加密功能 支持数据及资源级别访问安全控制,可灵活对脱敏数据进行管理 更低的 建设成本     产品自主化 量身定制适合应用的实践路线 智能部署,比同类产品实施节省一半时间 基于大量实践的,通用解决方案 33 大数据治理平台: ETL 34 大数据治理平台:元数据标准管理 35 大数据治理平台:段码数据标准管理 36 大数据治理平台:信息类管理 37 大数据治理平台:数据资源目录 38 大数据治理平台:信息类授权 39 大数据治理平台:质量管理系统 —— 规则定义 40 大数据治理平台:质量管理系统 41 大数据治理平台:质量管理系统 42 大数据治理平台:质量管理系统 43 大数据治理平台:数据台账 44 大数据智能分析平台 大数据知识挖掘的核心引擎 c 1 c 2 c 3 c 4 c 5 c 6 c 7 c 8 c 9 … 45 大数据分析平台关键能力 开放弹性 架构  真正无共享的海量并行处理架构  工业标准的 X86 平台  服务器资源按需分配,按需搭建集群,按需缩放集群规模 在线线性 扩展   增加节点可线性增加存储、查询和加载性能 支持在线扩容,扩容期间保证系统继续对外提供服务 拥有成本 可控   保证用户不被专有平台锁定 企业初期投入和后续扩容的成本可控 海量并行 处理 r1 r2 r3 r4 r5   支持 PB 级的数据处理、存储和访问 在数据加载、处理、访问等各个环节最大化并行处理能力   优秀混合 负载 平台持续 可用 按需分配资源( CPU 、内存、 IO ) 动态调整资源  数据镜像、硬件冗余等多种容错技术保证系统高可用  故障切换和恢复,对用户透明  扩容期间可持续对外服务 易于管理 维护   直观的图形化界面,实时的状态监控 最大限度降低管理员的日常管理和维护工作 46 计算 存储 网络 开源架构 云平台管理 云平台安全 模型库 大数据资源开放共享平台 大数据分析架构(根据
下载文档到本地,方便使用
共 64 页, 还有 1 页可预览, 继续阅读
文档评分
请文明评论,理性发言.