京东物流超大规模仓储系统智能监控(32页)会 2 0 1 9 · 上 海 站 G O P S 全 球 运 维 大 会 2 0 1 9 · 上 海 站 京东物流超大规模仓储系统智能监控揭秘 付正全 架构师 G O P S 全 球 运 维 大 会 2 0 1 9 · 上 海 站 目录 问题及挑战 1 超大规模监控系统解决方案 2 面向AIOPS的智能监控最佳实践 3 规划&展望 4 G O P S 全 球 运 维 大 会 2 频繁变化的资产,不可靠的CMDB 运维专家匮乏 复合型人才匮乏:AI和算法工程师+运维开发 G O P S 全 球 运 维 大 会 2 0 1 9 · 上 海 站 目录 问题及挑战 1 超大规模监控系统解决方案 2 面向AIOPS的智能监控最佳实践 3 规划&展望 4 G O P S 全 球 运 维 大 会 2 0 1 9 · 上 海 站 对监控的认识 什么是监控? 为什么需要监控? 题 智能客服机器人 提供智能客服机器人服务,根据人员信息自动推测可能的问题及解决方案 G O P S 全 球 运 维 大 会 2 0 1 9 · 上 海 站 目录 问题及挑战 1 超大规模监控系统解决方案 2 面向AIOPS的智能监控最佳实践 3 规划&展望 4 G O P S 全 球 运 维 大 会 2 0 1 9 · 上 海 站 故障快照 出现告警自动抓取现场快照信息0 积分 | 32 页 | 2.32 MB | 19 天前3
美国研究报告:2025数据中心市场 平衡前所未有的机会与战略风险.... ..........................................................................................12 超大规模主导地位....................................... ...................................................... 已 经达到或接近容量,迫使租户将电力可用性和可扩 展性置于传统市场偏好之上。尽管需要大量资本投 资,二级和三级市场仍吸引了越来越多的关注。 数据中心行业在2024年经历了前所未有的变革, 这是由超大规模运营商的历史性吸纳率和人工智能 (AI)的快速发展所推动的。各大市场的空置率下 降至历史最低水平,加剧了对空间和电力的竞争, 并要求在土地、开发和基础设施方面进行重大投资 。 投资者渴望参与到该行业的发展,但成功需要不只 .4吉瓦增加到2024年的超过18吉瓦——还不包 括另外30吉瓦的计划产能。 1 这种增长是由数字化转型的加速步伐以及人工智能在各个行业的日 益普及所驱动,亚马逊、谷歌、Meta、微软和甲骨文等超大规模企业领导了这一需求增长。 平衡前所未有的机会与战略风险 0 2,000 4,000 6,000 8,000 10,000 12,0000 积分 | 53 页 | 6.67 MB | 5 月前3
ICDT融合的6G网络白皮书5.0(2025)融合的关键技术章节重点介绍“解决方案”。与 4.0 版本相比,本白皮书的侧重点 有所变化,4.0 版本主要集中在对各项技术面临的研究挑战进行系统梳理,而本版则更加关 注这些挑战的解决方案及其最新进展。本章节特别聚焦于超大规模 MIMO、通感一体化、 AI 与通信融合、语义通信以及量子计算等领域的关键技术突破。针对上一版本中提出的问 题,本白皮书通过深入分析每个技术领域的最新进展,结合仿真数据和原型测试结果,系统 ............................11 2.1 超大规模 MIMO 技术...................................................................................................11 2.1.1 集中式超大规模 MIMO............................... ICDT 融合的关键技术 2.1 超大规模 MIMO 技术 2.1.1 集中式超大规模 MIMO 2.1.1.1 低复杂度信号处理 相对于传统的大规模 MIMO 系统,6G 集中式超大规模 MIMO 系统的天线阵列规模更 大。集中式超大规模 MIMO 系统信号处理所涉及的大量的矩阵求逆等运算的计算复杂度随 天线阵列规模的增大呈指数级增长。 为降低集中式超大规模 MIMO 系统的信号处理的复杂度,一种有效的方式是将高维度10 积分 | 88 页 | 5.88 MB | 5 月前3
中兴-面向智算场景的高性能网络白皮书2025高性能数据中心网络(HP-DCN).......................................................................................3 3.1.1 支持超大规模组网是基础....................................................................................3 3.1.2 超高稳定性是前提 ......................................................................................... 12 5.1 超大规模组网关键技术............................................................................................ Round-Trip Time 往返时延 ZTP Zero Touch Provisioning 零接触配置 3 高性能网络关键需求和挑战 3.1 高性能数据中心网络(HP-DCN) 3.1.1 支持超大规模组网是基础 在Scaling Law(扩展定律)的驱动下,万卡GPU训练集群已成为AIGC核心玩家的及 格线,智算中心正迅速朝着超万卡级别的规模迅速发展,国内云商如阿里巴巴、百度等陆续 宣布10 积分 | 41 页 | 1.89 MB | 6 月前3
中国算力中心行业白皮书算力中心供给分析 IV. 算力中心供需研判及未来展望 V. 附录 报告研究背景与主要研究结论 4 报告研究背景 • 纵观算力中心发展历程,移动互联网时代与云计算时代的技术革命催生了集约化、超大规模化的数据中心需求,由此孕育出了算力中心定制批发的业 务模式,并且该业务模式在2015-2020年间实现了快速增长。然而,伴随着移动互联网用户红利见顶、新基建边际效应递减及后疫情时代经济周期波动, 全参微调 局部微调 算力需求 超大规模 千卡~万卡 大规模 数百卡~千 卡 较小规模 单卡~8卡 起步 小规模 单卡1卡起 步 工程难度 很高 TP/DP/PP并 行,海量数据 高 基模选择、 高质量数据 较高 十万~百万 条指令集 一般 <万条指令 集 推理 To C推理 To B中心 To B边缘 算力需求 超大规模 千卡以上 大规模 数百卡 小规模 中国各行业智能算力应用分布,2023 ➢ 互联网头部厂商大量采购智算芯片 相较海外,国内智算中心正处于高速增长期,中国各行业对智算的需求急剧上升,其中互联网行业是最大需求方, 互联网巨头积极投身AI领域并大量采购智算服务器,促使超大规模算力中心迎来上架率激增,市场库存快速消化。 注:1. AI服务器是指基于GPU、FPGA、ASIC等加速芯片,专门提供人工智能训练和推理所需计算能力的服务器系统。 DeepSeek的出现推动10 积分 | 54 页 | 6.96 MB | 5 月前3
智算产业发展研究报告(2025)-天翼智库恩宣布启动“投资人工智能(InvestAI)”计划,目标筹集 2000 智算产业发展研究报告(2025) 6 亿欧元用于人工智能投资,并专门设立 200 亿欧元基金用于建设 欧洲人工智能超级工厂,以训练高复杂度、超大规模的 AI 模型。 4 月 9 日,欧盟发布“人工智能大陆行动计划” [5],战略核心是将 欧盟固有优势(如高质量人才储备和强大传统产业基础)转化为 AI 发展的关键加速器,力争成为人工智能领域的全球领导者。 2024 年资本支出总额为 2460 亿美元,较 2023 年(1510 亿美元)大幅 增长 63% [16]。Synergy Research Group 数据显示,截至 2024 年底, 全球超大规模数据中心数量达 1136 个,其中,亚马逊、微软和谷 歌三家合计占据全球总容量的 59%,其次是 Meta、阿里巴巴、腾 讯、苹果、字节跳动等。2025 年,微软、谷歌、亚马逊和 Meta 继续扩大 式部署成为新方向。谷歌已组建跨多个智算中心的大规模集群,完成 Gemini Ultra、Gemini 1.5pro 等大模型训练;OpenAI 计划分五个阶 段建设多个智算中心,并通过多智算中心互联最终打造百万卡级别的 超大规模基础设施。中国电信基于国产化算力完成跨百公里千亿参数 模型在千卡规模下的分布式智算中心互联验证,初步证实大模型跨智 算中心分布式协同训练的可行性。 3、AIDC 基础设施持续升级,绿色化转型不断深化10 积分 | 48 页 | 3.12 MB | 1 天前3
2025年金融操作系统AI创新与融合实践报告⚫ 针对自主创新芯片服务器优 化 ⚫ 针对自主创新数据库的性能 优化 ⚫ 针对资源利用率的有效提升 15年磨砺 海量实践铸成Ten ce ntOS Ser ver • 支撑腾讯云上用户超大规模的部署和运 行,持续不断的优化,规避故障,提高 稳定性,经受用户关键业务考验 190万+CVM数 经受腾讯云用户关键业务考验 • 从2010年起持续对Linux内核进行贡献 • 连续6年入选全球“KVM开源贡献榜 打破TPC-C 世界纪录 TDSQL+TencentOS组合 国内主流数据库厂商 互认证(部分) 云原生操作系统:轻量安全的云原生底座 国内主流云平台/容器平台 互认证(部分) 基于腾讯云超大规模云原生运营过程中积累的自主研发能力,支持腾讯核心业务的高效运转。云原生操作系统具备深度优化的云原生能力,专为容器、微服 务等架构打造,提供 NetTrace、SLI及 RUE 混部系统等核心特性20 积分 | 13 页 | 2.55 MB | 1 天前3
2025年电子元件供应链的未来之路报告-从过剩到平衡单元)专为高算力AI(人工智能)任务设计, 能在与超大规模的定制化软件层协同运行时 显著提升能效。 Broadcom(博通)CEO(首席执行官)Hock Tan预测该领域将迎来爆发式增长,2027年 的AI(人工智能)及AI(人工智能)网络相关 营收预计将从当前的150至200亿美元跃升 至600至900亿美元。亚马逊AWS、谷歌 云与微软Azure等超大规模云服务商正与 Broadcom(博通)联合开发AI(人工智能) 点击此处下载 这一趋势虽预示着专用芯片市场扩容,但业 界专家普遍认为其互补性作用远大于替代性: 通用型GPU(图形处理器)在基础AI(人工 智能)算力中占据主导地位,定制化芯片则 专注于解决超大规模场景需求。此类技术演 进不仅重塑了AI(人工智能)基础设施格局, 更为电子元器件产业注入了持续的增长动能。 AI(人工智能)硬件引领半导体产业革新 HPC(高性能计算)与服务器预计将在2025年20 积分 | 18 页 | 5.59 MB | 13 天前3
火山引擎新一代边缘云解决方案(16页 PPT)影视制作 装修设计 数字可视化 渲染场景 资源编排 CPU 云主机 GPU 云主机 高效云盘 VPC 网 络 弹性 IP 火山引擎边缘云 超大规模边缘资源 超高产品性能 超流量场景验证保障 高性能标准硬件资源 NVMe SSD IO 时延 <1 ms 内容分发和加速网络创新 边缘计算节点创新 异构算力 CPU\GPU\ARM 自研高性能实例 PPS>700W 支持自定义限速 多种计费模式 云边镜像 ¢ 键 分 发 带 超大规模的接入点 单节点海量流量承载能力 智能调度 提供质量稳定加速资源 自研的传输优化、智 能缓存、动态路由 边缘渲染 边缘智能 火山引擎边缘云产品创 新 新基础 底座 离线渲染10 积分 | 16 页 | 1.93 MB | 1 天前3
2025年6G“零中断”网络设计白皮书-中移智库发二 次危机,故障影响范围持续扩大、定位复杂度进一步增加,恢复时间延 长。 做好风险化解,避免大面积瘫痪故障:数据网元(例如UDM、HSS)作 为移动通信网核心所在,该设备的故障将引发超大规模的用户重注册、 进而引起信令风暴,需要考虑相应机制分担数据网元故障后的风险与压 力。 做好动网预演,避免操作不当带来风险:部分事故是由于管理机制不完 善,在网络升级改造、调整维护时缺少预演预验证手段,导致一些误操 机制和4/5G网络形成新形态的高低制式间的互补与兜底。 1.3 6G 网络可靠性挑战分析 6G网络将覆盖更广泛的应用场景,赋能多行业、多领域的智能化服务。ITU-R 在2023年明确了6G六大核心场景,包括沉浸式通信、超大规模连接、极高可靠低 时延、感知与通信的融合、人工智能与通信、泛在连接。这些新场景普遍要求网 络提供更高稳定性,同时对网络可靠性也提出一些新挑战。 图 2 ITU 定义 6G 六大核心场景 1 P2P 动态组网,需实 时组建协作网络并共享环境信息,现有网络的静态子网管理与路由机制难以满足 动态协同需求,亟需提升网络动态组网与智能调度能力以保障业务可靠性。 1.3.3 超大规模连接,瞬时信令冲击加倍 6G 超大规模连接场景下,海量物联设备接入(每平方千米可达百万至亿级) 对网络可靠性形成多重挑战。终端规模百倍于 5G 时代,网络异常恢复时的大规 模重连易引发信令风暴,远超现有网络抗 “浪涌”0 积分 | 36 页 | 2.50 MB | 1 天前3
共 135 条
- 1
- 2
- 3
- 4
- 5
- 6
- 14
