A级数据中心建设运营汇报方案(29页 PPT)
11.70 MB
29 页
0 下载
4 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pptx | 3 |
| 概览 | ||
A 级数据中心建设运营 汇报方案 Contents A 级数据中心建设 01 数据中心节能专篇 03 目录 A 级数据中心运营 02 A 级数据中心建设 01. 数据中心标准规范 《数据中心设计规 范》 GB 50174- 2017 《数据中心基础设施施工及验收规 范》 数据中心等级评定标准 T/CECS 488-2017 数据中心制冷与空调设计标准 T/CECS 487-2017 数据中心供配电设计规程 T/CECS 486-2017 数据中心网络布线技术规程 GB 50462-2015 T/CECS 485-2017 序号 楼层 / 区域 房间名称 备注 1 数据机房 1 2 数据机房 2 3 数据机房 3 4 数据中心监控室及设备间 5 气瓶间 6 配套空调机房 7 配电房 8 UPS 机房 9 电池室 10 配套空调机房或间 施工范围 数据中心是在建筑物内,按照统一的标准,建立数据处理、存储、传输、交换、综 合分析为一体化数据信息管理体系,数据中心为信息系统提供稳定,可靠的基础设 施和运行环境,并保证可以方便地维护和管理信息系统 施工内容 弱电智能化系统 • 信息网络系统 • 视频安防监控系统 • 出入口控制系统 • DCIM 系统 • 微模块 机房装修 • 吊顶 • 墙面 • 地面 • 活动地板 电气专业系统 • 电能管理系统 • 封闭式密集型铜母 线槽 • 高、低压配电电缆 及电线 • 接地 • 照明 • 次配电布线 • 低压配电箱 • 直流屏 • UPS • 阀控式密闭铅酸蓄 电池 • 精密列头柜 暖通专业系统 • 空调机 • 风机 • 风机盘管 • 变频多联式空调 ( 热泵 ) 机 • 给排水 • 管道 施工总体控制 1 :安全性 • 在整个施工过程中,安全始终是最重要的。确保施工人员遵守安全规范,佩戴必要的安全装备,并采取适当的防护措施,如避免触电、坠落和火灾等风险。 2 :合规性 • 确保施工符合相关法律法规和建筑规范。了解当地建筑许可要求,并遵守电气、消防和安全等标准,对于规范中的强条严格执行 3 :质量控制 • 对施工过程进行质量控制和质量检查,确保安装的设备和系统符合规范和预期要求。 4 :沟通与协调 • 与各个供应商、承包商和相关团队进行密切合作,确保施工进度和质量得到有效控制。及时沟通并解决问题,确保各项工作协调进行。 5 :测试和调试 • 在完成每个施工阶段后,进行必要的测试和调试工作,确保安装的设备和系统正常运行,并满足设计和性能要求。 6 :文件记录 • 保留所有施工过程中的相关文件和记录,包括施工计划、工程图纸、材料清单、施工报告和测试记录等。这些文件将对后续的运维和维护工作起到重要的参考作 用。 7 :培训和交接 • 在施工完成后,对数据中心的相关人员进行培训,使其熟悉设备和系统的操作和维护。同时,与运维团队进行充分的交接,确保顺利过渡到正常运营阶段 各系统的施工注意点 1 :弱电智能化系统 • 与甲方做好前期沟通,充分理解网络架构,网络拓扑、子网划分、设备布局,为网络布线和网络设备安装做好充分准备 • 微模块应为工厂预制化组装并经过严格测试的成熟产品,与供应商密切合作,做好厂验,确保设备的正确安装和配置。 • 使用 DCIM 系统进行资源管理和规划,包括机柜利用率、电力负载、温度和湿度等参数的监控和分析,以优化数据中心的效能和资源利用率 2 :机房装修 • 注意与空调送回风管道、给水排水管道、消防管道、配电桥架、等电位接地、综合布线等隐蔽工程的交叉和施工作业顺序 • 注意噪声问题,例如风道和风机的隔音特性,机房内部的吸音材料,吸收噪音,避免共振并减少回声 • 做好机房装修的成品保护,装饰材料、设备、装置的外观污染或破损会直接影响工程顺利验收交接 3 :电气专业系统 • 遵守电气安全规范和标准,包括电气设备的接地和绝缘要求,电线电缆的正确敷设和连接,安装过载保护和短路保护装置等等 • 对于一类含有腐蚀性液体的蓄电池,在安装时要格外小心。必须采取排气防护措施 • 注重细节,例如接地系统中不带电金属的等电位连接,连接处的防腐处理,不得串接等等 4 :暖通专业系统 • 管道、阀门、连接点的保温绝缘处理非常关键,使用合适的绝缘保温材料和方法,减少能量损耗和冷凝水的产生。以提高系统的效率和节能 • 循环冷媒为水,管路出现泄漏会严重威胁机房安全。必须确保供水的正常运行和安全性。避免漏水和堵塞问题。 • 在给排水管道的施工中,必须充分考虑防水措施,确保机房的地板和墙面不受水损坏 技术负责人 项目经理(总负责人) 工 程 项 目 部 安全员 材料员 机械员 劳务员 施工员 施工一队 施工二队 施工三队 造价员 质检员 资料员 勘察设计负责人 施工负责人 网络工程师 系统集成工 程师 项目组织管理机构 我司委派具有同类型工程施工管理经验 的优秀管理人员组成工程项目经理部, 按照我司项目管理模式,建立的质量保 证体系来运作,形成以全面质量管理为 中心,以专业管理的科学化管理体制, 高效地组织和优化企业及社会各生产要 素,以出色地实现我企业的质量方针和 质量目标,以及对业主的各项承诺。 人力资源组织 根据我们在机房工程的实施经验,施工小组按合理化专业划分:弱电智能化专业组、装修施工专业组、电气 施工专业组与暖通施工专业组,确保本项目的施工质量和施工工艺,同时根据工程进度投入劳动力,保证以 最优质的服务完成本项目 工种 按工程进度投入劳动力情况 深化设计 施工准备 管槽施工 线缆敷设 设备安装 系统调测试 系统试运 行 培训 竣工验收 售后服务 设计人员 9 2 2 2 2 2 2 2 2 工程管理人员 2 8 8 8 8 2 2 2 3 1 操作工人 2 30 30 20 10 2 1 调试工程师 6 2 3 2 其它人员 2 2 2 2 2 2 2 2 售后服务工程师 2 2 合计 5 14 42 42 32 22 10 9 11 4 劳动力投入 物资调配 材料设备:编制与施工进度计划相匹配的材料设备采购计划,循序渐进, 且我公司已与行业领域内的国内外诸多知名厂商建立了稳定的战略合作 关系,并且把为客户提供一揽子解决方案作为我们一切工作的出发点, 能保证本项目设备材料稳定供货。 机械设备:特别是针对机房装修工程、高低压配线配管、桥架安装、机 房大型设备场内运输等所用的机械设备,应提前做好规划,保证机械设 备的正常使用。 检测仪器:编制与施工进度计划相匹配的检测仪器使用计划,特别是各 系统的测试和验证,应提前做好资料收集,仪器准备,包括福禄克网络 测试仪,温湿度计,热像仪,气流计、照度计等。 物资调配 调试与测试 运维 测试 故障切 换 灾难预 演 运维应 急流程 验证 功能 测试 ATS 系 统联调 UPS 系 统联调 柴油发 电机系 统联调 BMS 测试 散热系 统联调 精密空 调系统 联调 冷机系 统联调 性能调 试 柴油发 电机 UPS 配电柜 ATS 水系统 冷冻机 组 精密空 调 BMS 新排风 严格意义上的数据中心基础设施综合测试是指从“图纸设计审 查、设备选型审查、工厂测试见证、到货检查见证、单机 测试、单系统测试、联合系统测试”等一个完整的测试验证 过程。 1. 为使系统设备、平台能正常安装和运行,我司有责任提供相应的培 训, 培训内容与合同内容相一致。 2. 培训计划和内容由我公司根据客户实际要求作出相应方案。 3. 培训的时间、人数、地点等具体内容由客户方和我司商定。 4. 客户方为培训人员提供设备、场地、资料等培训条件。 培训 根据我司经验,机房工程涉及到大量的软件操作和设置, 例如 DCIM 系统,电能管理系统均需要详细讲解和培训, 这是系统是否能顺利投入使用,稳定运行的关键因素之一。 缠绕式标签 01 旗形标签 02 机柜正面 03 机柜后面 04 施工细节 线缆隐藏 01 预留空间散热 02 PE 线跨接 03 图表标识 04 A 级数据中心运营 02. 专业工程师 运维管理模式 服务厂商 · 实施方 接任务 & 调资源 & 做实施 & 管交 付 客户经理 项目经理 工程师 工程师 项目经理 工程师 工程师 数据中心 · 业主方 定目标 & 立项目 & 下需求 & 做考 核 部门领导 业务工程师 数据中心 平台组 业务工程师 分组组长 业务工程师 业务工程师 分组组长 服务 协同 全程管控 ( 含考核 ) 考核验收 施工反馈 业务组 承建方 拆预算 & 派任务 & 做管控 & 保成 果 主管领导 专家顾问组 运维工程师 项目总监 运维工程师 运维工程师 技术资源部 运维服务团队组成 主管领导:参与年度目标、项目建设规划与项目运维预算的制定、调整的讨论,升级调整优化工作的验收审核,对接数据中心领导, 处理服务中重大风险、争议、投诉的处理 项目总监:对接中心部门领导,负责运维工程师上报的项目风险、争议、投诉的跟进处理;集成运营商项目经理的管理与业绩考核; 厂商服务(订单 / 工单)考核与验收结果的审批;负责整个项目执行过程的管控(进度、质量、文档、成本、验收等),确保项目任务 按时交付 运维工程师:常驻现场,通过不同的方式响应客户的需求,现场及远程为客户诊断、排除故障,对客户的问题进行汇总、分析,并提 出合理的解决办法;负责项目任务的分析、工单拆分与下发,负责服务厂商服务的定期考核 专家顾问组:由多名资深技术专家组成,主要负责对数据中心的规划设计,对用户提供安全评估、性能评估、稳定性评估、可靠性评 估、可用性评估,隐患预警报告;高级技术培训 技术资源部:由几十名资深专业技术人员组成,负责项目的规划;项目工程的实施;日常运营维护的远程、现场支持服务;用户故障 的诊断排查; 服务支持手段 心 为 客 户 提 供 7×2 4 小 时 响 应 的 服 务 平 台, 客 户 若 对 本 项 目 产 品、 技 术 有 疑 问 或 发 现 系 统 有 故 障 时, 可 及 时 得 到 技 术 支 持 服 务。 1 : 7×24 热线电话支持 为 客 户 的 本 项 目 的 设 备 提 供 合 同 约 定 的 设 备 保 修 服 务, 并 且 提 供 现 场 备 件 支 持 和 产 品 系 统 预 防 性 维 护 服 务。 2 :提供项目及时快捷的设备保修 服 务, 并 且 可 根 据 客 户 的 需 要 和 授 权, 通 过 宽 带 方 式 进 入 客 户 的 网 络 系 统, 对 相 关 软 件 进 行 检 查, 并 确 认 问 题 所 在, 解 决 问 题。 3 :远程故障诊断处理服务 出 的 维 修 要 求, 经 判 断 为 硬 件 故 障, 我 公 司 保 证 客 户 在 约 定 时 间 内 得 到 无 故 障 备 用 设 备, 并 到 现 场 进 行 设 备 的 硬 件 更 换。 4 :免费保修期内的硬件故障处理服务 严 重 故 障 或 状 况, 我 公 司 工 程 师 将 以 最 快 的 方 式 到 达 现 场。 为 项 目 中 主 要 设 备、 软 件 的 功 能 扩 充 提 供 约 定 的 免 费 现 场 支 持 服 务。 5 :现场技术支持服务 得 客 户 同 意 的 情 况 下, 为 客 户 提 供 稳 定 的 高 版 本 软 件 的 免 费 升 级, 并 根 据 版 本 情 况 提 供 软 件 更 新 的 资 料 说 明 文 本 和 相 关 技 术 资 料。 6 :软件升级支持服务 个 重 要 组 成 部 分, 由 我 公 司 的 资 深 售 后 工 程 师 遵 照 客 户 的 统 一 安 排, 对 各 子 系 统 进 行 现 场 定 期 巡 检, 并 将 正 式 的 例 检 报 告 上 交 业 主。 7 :定期巡检服务 机房运维阶段需维护事项 设备维护: • 定期检查和清洁设备,包括服务器、网络设备、 UPS 等,确保它们的正常运行和散热性能。 • 检查设备的电源线路和连接,确保其稳定性和安全性。 • 更新和升级设备的固件和软件,以修复漏洞、提高性能和功能。 暖通维护: • 定期监测和记录机房的温度和湿度,确保它们在适宜的范围内。 • 检查空调系统的运行状态,清洁过滤器、排水管道等,以保持良好的冷却效果。 • 如果温度或湿度异常,及时调整空调设备或采取其他措施,以防止设备过热或潮湿。 供电维护: • 监测和记录机房的电力消耗,及时发现异常,进行节能改进,降低 PUE 节能的机会。 • 定期检查和维护电源配电设备,如电池组、 UPS 等,确保其可靠性和备份能力。 • 定期进行电力负载测试,以确保配电系统能够满足机房设备的需求。 安全维护: • 监控和审计机房的安全日志,跟踪各类报警及故障信息 • 对机房进行物理安全巡检,确保门禁系统、监控摄像头等设备的正常运行和覆盖范围。 灾难恢复计划: • 协助制定更新机房的灾难恢复计划,包括备份恢复、紧急停机和数据中心数据升级等情况 • 定期进行灾难恢复演练,评估计划的有效性和可行性,并及时修正和改进。 故障分级及处理方案 故障级别 定义 处理方案 响应时间 一级故障 指设备在运行中出现系 统瘫痪或服务中断,导致设 备的基本功能不能实现或全 面退化 1. 当得知系统出现故障时,首先在最短的时间赶到故障现场查看故障点状态, 并分析故障原因; 2. 立即报告给项目总监与数据中心领导,告知领导故障原因; 3. 运维工程师在排查出故障后,如能够立即解决,则立刻解决故障,如需要设 备厂商的技术人员到现场,应立即拨打技术厂商的技术工程师联系电话,请 求立即到现场进行故障排除; 4. 如果因硬件设备出现故障而无法修复,需要更换时,应报数据中心领导,同 时立即办理硬件更换事宜; 5. 在故障排除后,运维工程师对故障原因及解决办法进行详细说明,填写“运维 服务单”。 30 分钟电话响应,我 方及原厂工程师和备件 2 小时内到达现场 二级故障 指设备在运行中出现的 故障具有潜在的系统瘫痪或 服务中断的危险,并可能导 致设备的基本功能不能实现 或全面退化 1. 当得知系统出现故障时,首先在最短的时间赶到故障现场查看故障点状态, 并分析故障原因; 2. 立即报告给项目总监,项目总监应通过电话或当面把故障报告数据中心领导; 3. 运维经理在排查出故障后,如能够立即解决,则立刻解决故障,如需要设备 厂商的技术人员到现场,应立即拨打技术厂商的技术工程师联系电话,请求 立即到现场进行故障排除; 4. 在故障排除后,运维工程师应对故障原因及解决办法进行详细说明,填写“运 维服务单”。 30 分钟电话响应,我 方及原厂工程师和备件 4 小时内到达现场 三级故障 指设备在运行中出现的 直接影响服务,导致系统性 能或服务部分退化的故障 1. 当得知系统出现故障时,首先在最短的时间赶到故障现场查看故障点状态, 并分析故障原因; 2. 运维经理在排查出故障后,立即着手解决; 3. 在故障排除后,对所发生故障的设备进行事后跟踪; 4. 在故障排除后,运维工程师应对故障原因及解决办法进行详细说明,填写“运 维服务单”。 1 小时电话响应,我 方及原厂工程师和备件次 日到达现场 针对硬件故障处理响应措施 实施监控系统:通过 DCIM 系统,监测硬件设备的运行 状态、温度、电力消耗等关 键参数。 设置警报通知机制:设定阈 值和警报条件,当硬件设备 出现异常时,及时发送警报 通知给相关人员。 实施巡检和定期检查:定期 进行设备巡检,检查设备是 否存在可见的物理故障迹象, 如电线插头松动、指示灯异 常等。 故障发现: 故障确认:一旦接收到故障 通知或监控警报,立即进行 故障确认,确定是硬件故障 而非其他问题。 故障定位:使用适当的故障 排除工具和仪器,对故障设 备进行定位,找出故障原因 所在。 故障修复:根据故障定位结 果,采取相应的修复措施, 如更换故障部件、重新连接 电缆、调整设备设置等。 测试和验证:在修复故障后, 进行必要的测试和验证,确 保设备恢复正常运行。 故障处理: 故障记录和报告:对发生的 故障进行详细记录,包括故 障描述、定位和修复过程、 使用的工具和材料等信息。 生成故障报告,用于后续的 故障分析和改进。 分析和改进:定期分析故障 记录和报告,寻找故障发生 的共同模式和原因,提出改 进措施,以减少类似故障的 再次发生。 更新文档和知识库:根据故 障处理经验,更新相关文档 和知识库,使运维成员能够 更好地应对类似故障。 故障闭环: 应急方案准备:制定硬件故 障的应急切换方案,包括备 用设备的准备和配置、网络 切换计划等。 快速切换:一旦发生硬件故 障,根据应急切换方案,迅 速启动备用设备,实施网络 切换或设备替换,以确保服 务的连续性和可用性。 故障恢复:在故障处理完成 后,评估故障设备的修复时 间和方案,进行必要的修复 工作,并恢复正常运行。 故障应急切换: 数据中心节能专篇 03. 机房 PUE 的目标 序号 项目名称 实施手段 年均 PUE 数值 1 百度云计算(阳泉)中心 整机柜服务器、高压直流 + 市电直供、机器学习控 制系统、高温服务器等技术 1.23 2 阿里巴巴千岛湖数据中心 湖水自然冷却系统、太阳能电池板、高压直流等技术 1.28 3 腾讯青浦三联供数据中心 天然气三联供、离心变频冷机、磁悬浮冷机等技术 1.31 4 阿里巴巴 / 张北云联数据中 心 无架空地板弥散送风、全自动化 BA 系统实现自然冷 源最大化等技术 1.23 PUE 电力使用效率 power usage effectiveness PUE 是评价数据中心能源效率的指标, 是数据中心消耗的所有能源与 IT 负载使用的能源之比。 PUE= 数据中心设备总能耗 /IT 设备能耗 PUE 是一个比值, 越接近 1 表明能效水平越好。 工业和信息化部、国家机关事务管理局、国家能源局三部门联合印发的《关于加强绿色数据中心建设的指导意见》,明确 提出至 2022 年,数据中心平均能耗基本达到
| ||
下载文档到本地,方便使用
- 可预览页数已用完,剩余
27 页请下载阅读 -
文档评分


市级数字政府电子政务大数据中心项目建设和运营方案(48页 Word)
智慧校园数据中心建设方案(157页)