中国联通数字化监控平台稳定性保障工具落地实践被动应急 故障统一调度 系统具备应急预案 故障点人工恢复 统一变更入口 工具建设 集团+省分 几百套系统 跨系统全链路 定界诊断 主动预防 集团+分子公司 整体态势感知 混沌工程 故障自愈 变更追踪 变更管控 体系建设 故障发现 与诊断 故障恢复 与应急 故障预防 故障调度 体系演进 分布式架构挑战 运维生态挑战 数智运维挑战 端到端稳定性保障体系缺失,自动化、智能化故障处理能力不足 业务快速抢通 3、故障事后治理追踪全流程线上化闭环管理,确保故障 经验有效沉淀,整改措施有效落地 1、系统深度健康体检,全链路性能隐患分析 2、系统容量隐患深度分析 3、统一隐患闭环治理 告警、诊断、自动化作业能力组合贯穿‘监’与 ‘控’,实现多场景故障自愈 1、全链路读、写压力测试、评估链路容量水位 2、接口、UI自动化巡检及时发现业务异常 变更追踪与管控 故障自愈 隐患管理 稳定性测试 主机:内存、磁盘、CPU、网络指 标等 网络出、入流量、并发会话数、连 接数等 数据中心、网络设备、主机拓扑映 射关系 统 一 标 签 规 范 标 准 + 自 定 义 监控告警 数据可视 故障诊断 隐患分析 故障预防 ... Clickhouse 应用时序指标、trace、 方法调用明细 Prometheus 业务、服务、组件、资源 时序指标 Neo4j+Redis 拓扑数据10 积分 | 24 页 | 9.74 MB | 4 月前3
中国联通数字化监控平台稳定性保障工具落地实践数据孤岛: 应用、数据库、 中间件、云平台、 基础设施各管自身 集团 + 省分 几百套系统 跨系统全链路 定界诊断 故障自愈 混沌工程 主动预防 变更追踪 变更管控 集团 + 分子公 司 整体态势感 知 体系建设 故障发现 与诊断 故障恢复 与应急 故障预防 故障调度 体系演进 稳定性保障工具建设历程 、任务流程线上化绘制、管控,统一入口管理调度 3 、技术监督实现变更管控 稳定性测 试 故障管理 1 、全链路读、写压力测 试 、评估链路容量水位 2 、接口、 UI 自动化巡检及时发现业务异常 故障 自愈 告警、诊断、自动化作业能力组合贯穿‘监 ’与 ‘控 ’, 实现多场景故障自愈 稳定性保障工具聚焦 领域 变更追踪与管控 全栈可观测性 隐患 管理 规 范 标 准 + 自 定 义 Prometheus 业务、服务、组件、资源 时序指标 储、分析处理标准,提供可观测性能力数据基础。 数据可视 监控告警 故障预防 隐患分析 故障诊断 Neo4j+Redi s 拓扑数据 统 可观测性建设: 链路追踪20 积分 | 24 页 | 2.00 MB | 4 月前3
【智慧工厂项目】售前建设工作安排-模板我们提供什么: “我们为他们提供了那些能力” 结果: 情况:(职位、行业) 需要的能力: (何时、谁、做什么) 他说他们需要一种方法,在客户报障的时候,我们的维修 人员可以看到设备的实时参数,从而可以远程诊断故障, 较少差旅的次数; 现在他们的售后成本和人力成本减少了60% 痛苦表 职位和行业: 痛苦: 产品或服务: 通过物联网采集设备数据 角度 是不是因为……? 这个(痛苦)导致……吗? 维修效率低,售后成本高; R2原因 I2影响 C2能力 维保期内售 后 A:是不是因为差旅次数过多,导致售后成本高? A. 何时:在客户报障的时候 谁:维修人员 做什么:调出报障设备的历史运行数据,远程 诊断故障,小故障可以指导客户自行解决? 1.现在贵司在售后上,每年投入多少的成本? 2、现在贵司有多少维修人员? 技术部主管 (负责技术管理、制造设计、产品研发) 4、有多少比例的售后问题是可以远程解决的? 九宫格模型 售后主管受到了影响么? 这样会导致售后成本居高不下? 研发主管受到了影响么? 这样会导致设备销售增速放缓? 这个问题会导致维保收入降低? 这样会导致配件销售收入不可控? 诊断原因(R) 探索影响(I) 构想能力(C) 1)开放型 1、您认为现在设备销售竞争越来越激烈的原因是什 么? 1、哪些部门受到了影响? 1、要想解决这个问题,你们需要怎样的能力? 2、导致现在售后成本不断攀升的原因是什么?10 积分 | 13 页 | 40.95 KB | 5 月前3
华为:2025年鸿蒙生态应用开发白皮书V4.0的版本更新,可以快速获取用户对新版本的反馈意见,降低全网发 布后版本出现问题的风险。 2. 运维分析 提供崩溃服务、性能管理、智能分析服务及云服务监控,支撑开发者精准定位问题,同 时支持多维度分析,智能诊断问题并给出解决方案。 40 表 4-5:运维分析能力介绍 能力名称 简介 崩溃服务 帮助开发者快速发现、定位、解决应用崩溃(又称闪退)问题。无需开发 任何代码,即可 5、AI(Artificial Intelligence):机器学习、深度学习、自然语言处理、计算机视觉等 相关的开放能力。 6、系统(System):通信、安全、驱动程序、DFX、诊断和测试等相关的开放能力。 图 5-8:Kit 分类图 开放能力的检索和使用 在华为开发者网站上,开发指南和 API 参考,均以 Kit 的形式呈现,开发者可以查询某 个 Kit 的相关资料。 提供低门槛、高效率、多场景的大数据能力,包括质量 分析、性能调优、故障定位、行业风向等。同时支持多维度数据分析,智能诊断问题并给出 解决方案,为开发者明确质量优化方向,提升用户体验。 运维服务提供了低门槛、高效率、多场景的大数据能力,包括质量分析、性能调优、故 障定位、行业风向等。同时支持多维度数据分析,智能诊断问题并给出解决方案,为开发者 明确质量优化方向,提升用户体验。 图 8-1:运维监控架构图0 积分 | 122 页 | 5.04 MB | 4 月前3
基于SAP QM最全质量管理培训材【72页PPT】内部问题 Q 持续改进过程 - 质量通知单 任务 实施检查 问题描述 分析 缺陷原因 制定解决方案 质量通知单 - 问题处理过程 内部 触发 外部 触发 质量通知 诊断分析 缺陷分析 查找原因 改进任务 纠正作业 即时任务 即时作业 售后服务的检验 - 投诉 客户对产品 进行了投诉 创建通知单 通知单保存 质量通知单 验证 描述 缺陷 原因 任务20 积分 | 72 页 | 4.49 MB | 12 天前3
低空经济无人机采购投标方案种智能化技术的迅速发展,使得无人机的控制系统模块实现 数字化和智能化的发展目标成为可能。因此,在无人机模块 化设计的过程中,为了实现控制系统模块的便捷化,可以使 得操纵模式及结构的智能化,保证无人机能够实现自动修 复、诊断等智能功能。 3.机载装备模块 随着各种微型化电子器件的发展,合成孔径雷达等设备 不断的向着微型化的方向发展,其机载方式也得到了一定的 发展。而通过载荷的模块化设计可以实现模块化设计功能, 的定期点检、专业技术人员的精密点检三者结合起来的点 检制度。 2.五层防护线: (1)岗位操作员的日常点检; (2)专业点检员的定期点检; (3)专业技术人员的精密点检; (4)对出现问题进一步通过技术诊断等找出原因及对 策; (5)每半年或一年的精密检测。 (五)各生产单位要结合工艺要求和生产设备特点,组 织制定《生产设备点检维护作业指导书》,确保岗位按照规 范、统一的要求,开展设备点检工作。 计、分析,评价生产设备运行状况,开展维护维修工作的改 善活动,并为生产设备大修、更新改造提供决策依据。 (八)各生产单位要逐步实行生产设备点检信息系统的 计算机管理,做好生产设备状态监测故障诊断和失效分析等 技术的推广应用,不断提高生产设备点检管理水平。第九 章 生产设备检维修管理 (九)各生产单位要编制并完善所有生产设备的检(维) 修规程,规程参照 SHS01011~036-XXXX100 积分 | 531 页 | 2.81 MB | 4 月前3
华为:2025年鸿蒙编程语言白皮书混合应用),支持开发纯仓颉的静态库和动态库,在下载安装 DevEco Studio 后,开箱即用。在 DevEco Studio 上,仓颉的特性全貌将主要有以下方 面: 代码编辑:代码高亮、代码补全、语法诊断、悬浮提示、定义跳转、 引用查找、格式化等编码辅助能力,包括元编程相关的编码辅助能力。 编译构建:支持编译仓颉的 HAP/APP、支持编译仓颉的 HAR/HSP、 支持推送仓颉 HAP 包至手机运行能力。0 积分 | 65 页 | 2.09 MB | 4 月前3
共 7 条
- 1
