智算无界:AIDC的超越和重构-上海贝尔网络,承担系统业务调度与带内管 理流量,采用多层CLOS组网,通常部署为TCP/IP有损网络。几类网络通过逻辑或物理隔离,确保智算中心 高效协同,同时降低跨流量干扰。 为满足智算中心内部网络超大规模、超高吞吐、超低时延、超高可靠性的性能需求,构建智算网络的技 术体系如图2-2所示,包括智算网络基础设施层、拥塞控制层、流量调度层、网络协议层和集合通信层以及高 可靠性保障和智能化运维等功能模块。 业联盟正积极自主创新 全向智感互联OISA技术,Gen1支持800GB/s,相关标准和芯片已发布;智算中心网络主要传输协议是IB和 RoCEv2,这两者都是基于RDMA旁路卸载低时延技术。面对超大规模智算集群网络的更高要求,基于 RoCEv2进一步技术演进,中国移动提出全调度以太网(GSE)技术架构,超以太网联盟(UEC)提出新一代 UET传输协议,业界还创新发展分布式解耦DDC新架构,同 过自动化部署降低集群配置时间,提高网络管理效率;通过带 内遥测(INT)与自动化采集技术,构建全链路数字孪生;通过AI驱动故障预测、根因分析以及自愈动作闭环等。 2)智算网络演进与创新 随着超大规模智算集群建设的新需求以及技术创新的迭代进步,智算网络技术从硬件基础设施到网络架 构和协议,到网络无损和流量控制等,持续快速演进。根据业界的发展状态和趋势,如图2-4,规划梳理了其 大致的技术发展脉络:10 积分 | 38 页 | 9.31 MB | 23 天前3
2025AI供电的未来:重新定义AI 数据中心供电白皮书-英飞凌V/50 V 电压域转换至 6 V 的中间总线。图 10 显示了该模块及其实测效率曲线。 12 二、AI 服务器机架的供电 预测三:AI 服务器机架的功耗将超过 1 兆瓦 在针对拥有万亿级参数的超大规模AI模型进行训练时,需要将数千颗GPU集成在同一台机器中,并以同步模式运行。 机架之间的数据通信通常通过光通信实现,而 IT 机架内部的高速互连则依赖专用处理器,通过铜缆将每个 GPU 与 其他 到数百兆瓦级别。 在未来几年内,为满足规模日益庞大的 AI 模型对算力的无限需求,预计将出现专门的“AI 工厂”。在同一数据中 心园区内,此类设施的用电量将达到吉瓦级,甚至可能超过数吉瓦。多家超大规模数据中心运营商已发布了相关 建设计划 [2,3]。在训练过程中,大型 GPU 集群的负载剧烈波动,所引起的电力供应与电网稳定性问题,成为确保 这些数据中心安全运行的重大挑战。要应对这些挑战,必 率转换环节上,实施瞬态负载的主动缓冲。 此外,在设施层面部署大型电池储能系统(BESS)也将成为必需措施,以确保整个数据中心保持近乎恒定的负载 曲线。 英飞凌致力于沿着整个功率转换链路,支持超大规模数据中心运营商及系统供应商,共同实现可持续、高效且具 经济可行性的电力解决方案。功率半导体正是这些工作的核心所在,其目标包括: 17 • 将任意能源形式转换为处理核心电压所需的负载电流 •10 积分 | 24 页 | 14.75 MB | 23 天前3
数字孪生水利建设要点(32页 PPT)攻克数字孪生水利建设技术方面的难点 1. 算据方面 ( 底板 ) 应对思路 主要是满足数字孪生水利算力需求。 一是扩充计算资源, 针对相控阵雷达、 区域气候模式预报、 分布式 水 文模型、 格网化水力学模型等超大规模方程团迭代解算, 以及精细化时 空 分析、 海量数据挖掘分析、 大场景渲染展示等情景所需的高性能海量计 算 需求, 按照 “集约高效、 共享开放、 按需服务”的原则, 采用自建云、10 积分 | 32 页 | 2.14 MB | 23 天前3
2025年算力运维体系技术白皮书-中国信通服务个国家数据中心集群,“东数 西算”工程稳步推进,将东部海量数据传输至西部数据中心集群处理,充分利用西部 能源优势,降低运营成本。同时,大型互联网企业、科技巨头纷纷加大在算力领域的 投入,建设超大规模算力中心。 1.2.2 算力芯片结构多样化 算力中心和传统数据中心在服务器芯片结构上存在本质的差异。传统数据中心芯 片架构相对单一,主要以 CPU 为算力核心,基于 CPU 和云存储集群提供的相关云服务, 重新调整设备数量)。 3) 运维挑战:需定期检查 Leaf-Spine 链路带宽利用率,避免因节点数增加 导致的拥塞。 (2). 三层 Core-Spine-Leaf 架构: 1) 适用场景:超大规模集群 2) 架构特点: 增加 Core 层交换机,形成 Leaf→Spine→Core 的三级结构(如 256 卡 集群需 32 台 Leaf、32 台 Spine 和 32 台 Core)。10 积分 | 74 页 | 1.36 MB | 23 天前3
无线经济发展研究报告(2025年)-中国信通院-41页无线经济发展研究报告(2025 年) 25 新突破的行动方案(2023-2025)》中提出要超前布局 6G 未来网络, 完善数字基础设施,并统筹算力资源。在关键技术研发方面,北京 重点突破超大规模 MIMO、智能超表面、通感算智融合等核心技术, 并探索 RISC-V 架构芯片研发,形成全球领先的技术储备。在工业 和信息化部指导下,中国信息通信研究院依托 IMT-2030(6G)推进组,10 积分 | 41 页 | 3.04 MB | 23 天前3
共 5 条
- 1
