中兴-面向智算场景的高性能网络白皮书2025................................................................................... 12 5.1.1 大规模组网交换机:硬件基础,容量速率双升..............................................12 5.1.2 大规模组网路由协议:可扩展快速部署,组播能力提供...... 步过程;数据快递场景包括数 据灾备、大规模科学数据传递等。以上都需要广域网具备高性能海量数据传输的能力。 综上,面对大规模AI/HPC的计算、存储和通信需求,不仅数据中心内部的大规模密集 数据交换需要高性能网络的支撑,还需要网络能够高效地连接多个数据中心或站点,实现跨 地域的AI/HPC业务的高效协同。 本白皮书从面向智算业务的高性能网络需求和技术挑战出发,分析高性能网络技术发展 现状 要求,都需要放到支持超大规模网络的框架下重新考量。 支持超大规模组网的主要挑战包括: 1)交换机接入容量的限制 服务器GPU网卡数量和接口速率在逐渐增加,呈现每两年翻倍的趋势,当前规模商用 的GPU服务器网卡接口达到8*400G,支持800G的GPU服务器也已推出,为了满足接入需 求,减少设备数量,对单交换机容量提出了越来越高的需求,而单交换芯片的容量提升节奏, 明显落后于IO总线的发展,并且存在物理上限。10 积分 | 41 页 | 1.89 MB | 6 月前3
2025年智算中心液冷整机柜服务器开放架构多样化算力兼容研究报告......................................................................................... 27 4.3 交换节点 ................................................................................................ 给出了基于 Vera Rubin 和 Vera Rubin Ultra 芯片,代号 Kyber 的整机柜服务器架构。Kyber 架构尺寸与 OCP 标准机柜一 致,但将原来的正前方横插的计算板和交换板,改成前后分别竖插模式,引入 Midplane 替 代 GB200 NVL72 的 Cable Tray,极大减少机柜里的线缆长度。根据规划,Kyber 单机柜 中将放置 144 个 R 系列 12 柜部署兼容。 如图 3-3 所示,AI 整机柜硬件逻辑上分为计算系统、交换系统、机柜管理系统,各硬 件系统之间既相互独立又相互依存。每个 AI 节点对外提供独立的业务平面和设备管理平面, 业务平面通过业务交换模块组成整体业务转发系统,设备管理平面通过带外管理交换模块组 成 AI 节点整体 BMC 管理系统。同时,支持单独的机柜管理模块,实现机柜级部件的管理。0 积分 | 40 页 | 3.21 MB | 5 月前3
新型智算中心:网络成大模型训练瓶颈 ,节点内外多方案并存(24页 PPT)Infiniband 和 RoCEv2 ; Infiniband 网络主要包括 InfiniBand 网卡、 InfiniBand 交换机、 Subnet Management ( SM ) 、连接件组成; RoCEv2 网络 是一个纯分布式的网络,由支持 RoCEv2 的网卡和交换机、连接件、流控机制组成。 InfiniBand 在网络性能、集群规模、运维等方面具备显著优势。 • 投资建议: 卡服务器逐步转化为“超级服务器” ,基于存算一体架构的大算力芯片将开始逐步应用。 • 互联方案:内部打造统一的协议实现 CPU 、 GPU 、 A I 芯片、显存、存储等池化资源无缝连接;外部通过 GSE 等高性能交换网络,达到极高吞吐、极低时延的系统算力。 • 存储方面:在“超级服务器”内支持内存池化技术,对外拓展支持全局统一存储。 • 平台方面:构建基于算力原生平台的跨架构开发、编译、优化环境 数据量比 DP 小,点对点互联即可; 2 )张 量并行 ( TP ):将模型在“层”内进行切分,训练过程中前向和反向传播中都设计 Allreduce ,通信量大且频繁,通常要求全互联( FC )或交换拓扑( Switch )。 策略 通信模式 互联拓扑,带宽需求 数据并行 DP Allreduce 环状或全互联,常规需求,几 ~ 几十 GB/s 流水线并行 PP P2P 点对点相连,常规需求,几30 积分 | 24 页 | 947.01 KB | 4 月前3
基于可编程技术的6G用户面技术白皮书2025OpenFlow 和 OpenFlow 交换机的概念。OpenFlow 交换机相较于传统交换机有着本质不同。 OpenFlow 交换机将控制权上交给集中控制器,集中式控制器通过 OpenFlow 协议对 OpenFlow 交换 机中的流表进行控制,它会为特定的工作负载计算最佳路径,从而提高转发的效率。这种控制转发 分离的架构由集中式控制器对网络中的各种交换机设备进行综合管理,这种行为就像对网络进行整 年:通过 OpenFlow 将控制面和数据面分离,用户可以通过集中的控制端去控制每个 交换机的行为; 2015–2025 年:通过 P4 编程语言以及可编程 FPGA 或 ASIC 实现数据平面可编程,这样,在包 处理流水线加入一个新协议的支持,开发周期从数年降低到数周; 2020–2030 年:展望未来,网卡、交换机以及协议栈均可编程,整个网络成为一个可编程平台。 在 SDN 的架构中,由控制 其算力资源也将是分布式部署的。分布的算 力对数据转发的需求不同于传统的通信网络,数据通路将不只是从终端设备到核心网用户面节点的 一对一的方式,还需要实现终端设备到不同算力节点之间多点到多点的数据交换方式。6G 网络需要 进一步增强数据转发的灵活性来满足这种需求。 自动化智能化的管理编排 随着网络架构和功能的变化,6G 网络的编排管理也会变得更加复杂,自动化和智能化也是其发 展的趋势之一0 积分 | 34 页 | 4.53 MB | 5 月前3
Manus在AI Agent领域实现技术突破,AI驱动智算中心升级-中原证券Agent 领域实现技术突破,加速产业从工具型向 生产力驱动型的升级,并推动算力需求的持续增长。DeepSeek 的 开源和低成本特性使得国产显卡用于推理的性价比和投资回报率 上升,训练加推理将使用更多的高端交换机和光模块,我国算力自 主可控进程加速。头部云厂商 2025 年资本开支展望乐观,AI 竞赛 将进入高强度投入阶段,未来资本开支的持续增加将推动技术创 新。AI 算力产业链各环节需求持续高景气,建议关注:太辰光、仕 ...................................................................................... 21 2.7.2. 交换机 ................................................................................................. ................................. 21 图 49:我国以太网交换机出口额(亿美元) .......................................................................... 22 图 50:我国以太网交换机出口量(台) .........................................0 积分 | 28 页 | 2.98 MB | 5 月前3
2025智算中心行业研究:新一轮人工智能浪潮汹涌,算力底座万亿市场可期-20250430-深企投产业研究院-(一)AI 服务器 .................................. 30 (二)AI 芯片 .................................... 33 (三)交换机 ..................................... 36 (四)光模块 ..................................... 38 (五)液冷系统 12 国内算力中心服务重点企业(非上市) ...............26 表 13 国产 AI 芯片竞争格局 ..............................35 表 14 国内主要交换机厂商的代表产品 .....................38 表 15 全球光模块市场竞争格局 ............................39 表 16 硅光芯片/模块主要厂商梳理 接器(光纤、光模块)、网络设备(交换机、路由器)、算力设备(服 深企投产业研究院 5 务器)、存储设备(存储器)等,配套设备包括供配电设备(UPS 不间断电源、蓄电池、发电机、配电单元)、温控设备(冷源设备、 机房空调、新风系统)等,如下表所示。 表 2 数据中心内部设备 类型 设备种类 名称 IT 设备 连接器 光纤 光模块 网络设备 交换机 路由器 算力设备 服务器0 积分 | 49 页 | 2.69 MB | 5 月前3
2025年整机柜服务器产业研究报告Rack 1.0规范把机柜内部的宽度扩大为21英寸(538mm),横向空间的实际利用率提高近 20%。单位高度也放大到48mm,名为OpenU(OU),分为3个供电区,每个供电区13 OU,再加2 OU交换机,共41 OU。 12V直流集中供电是Open Rack V1架构上的另一特点,每个供电区的下方3 OU是电源框,通过3根在机柜后端 (横向)对称分布的铜排(Busbar)为上面10 OU空 购超过100柜近3000台服务器节点。首 批应用试点主要集中在“计算型”和“存储型”两类业务模型,均采用1U节点形态,围绕一体化交付、现场工程 化部署界面分工、机房运输/供电/散热环境适配改造、交换机集成及并柜等开展试点,并在业务上线后持续进行 能耗、业务稳定性的检测,从而积累了整机柜服务器应用的丰富经验和翔实业务数据。 随着移动云业务的快速成长,所承载的场景愈发丰富,对于服务器的扩展性和均衡性要求进一步提升,以1U 练过程中会产生海量临时参数, 如梯度、优化器状态、激活值等,这些数据均需要高效存取。因而快速的数据访问和高效的存储性能对于确保训 练过程的顺利进行至关重要。 AI模型训练过程中需要频繁的数据交换和大规模分布式计算,对网络带宽和低时延提出了极高的要求。由数 千甚至数万张计算加速卡组成的集群,在网络互连方案上,需要考虑诸多需求:超大规模、超高带宽、超低时延、 超高稳定性,因而需要采用新型高0 积分 | 63 页 | 4.83 MB | 4 月前3
CIO时代:央国企信创白皮书——基于信创体系的数字化转型(2022)网络设备泛指构建整个网络所需的数据传输、路由、交换等设备。网络设备 包含路由器、交换机、网络安全设备、SD-WAN 设备、无线产品、服务器等。网络 设备行业是支撑国家经济发展的战略性、基础性和先导性产业,受到政府的大力 支持,近年来网络设备市场规模整体呈增长趋势。2021 年中国网络设备市场规 模达到 664 亿元,同比增长 3.53%,其中 SD-WAN 发展迅速,同比增长 89.9%。 国内交换机市场的主要参与 改造上云两种。 4.2.6.1 信创平迁上云 如下图所示。从架构上,采用软件定义的数据中心架构升级替代传统 IT 架 构。具体技术上,采用国产的软件、服务器和以太网交换机,替代传统国外产专 用的存储硬件和网络交换机,采用国产分布式存储系统替代传统集中式存储系统, 采用国产虚拟化平台替代国外虚拟化平台。交付形式上,可以采用新型的具备一 体化交付能力的超融合方案替代传统的计算、存储、网络分别规划、部署、实施 31 图 4.3 大数据总体架构 采集交换:数据采集和数据交换相关的技术工具,通过数据采集完成多种来源的 数据间的传输与交换。 存储计算:数据存储和计算相关的工具技术与方法,提供文件数据、结构化数据 和对象数据等不同形态数据的组织方式,基于这些方式实现数据的分布式批量计 算和流式计算。 数据治理:基于数据采集交换、存储计算能力实现数据治理中的清洗转换、和加 工处理,10 积分 | 60 页 | 4.93 MB | 6 月前3
量子信息技术应用案例集(2024年)发的核心技术,能实现全线路扰动完全免疫,适用于地埋光纤、架 空光缆、跨江铁路桥等环境,已获得多项国内外专利授权和奖项认 可。 量子信息技术应用案例集(2024) 64 项目通过整合 QKD、QKS、QVPN 和交换机等关键设备,实现 了 QKD 技术与 IP-Sec VPN 技术的有效融合,构建了融合不同 QKD 系统的综合集成平台,能有效兼容全国范围内主要 QKD 系统的各种 加密设备,形成大规模、多技术混合的量子通信网络应用示范。 密钥交换 银行单位 QKD-R QKS QVPN 密钥交换 QVPN QVPN QVPN QVPN QVPN QVPN 安全管理 系统 漏洞扫描系统 堡垒机 CA 服务器 网络审计系统 病毒 服务器 主机监控 与审计系统 运维 管理区 入侵检测系统 防火墙 密钥交换 密钥交换 密钥交换 密钥交换 密钥交换 密钥交换 光交换 光交换 光交换 光交换 光交换 光交换 光交换 光交换 光交换 安全 防护区 防火墙 财务工作电脑 杀毒客户端 & 主机 监控与审计客户端 办公区 图 29 宁苏量子加密干线金融网络安全管控平台架构 四、 应用成效与前景 (一) 创新点/先进性/成效/潜力 项目采用基于诱骗态的 BB84 协议,以“法拉第-迈克尔逊”量子 编解码器方案为基础,结合高速弱相关光源、红外单光子探测器等 核心部件,优化0 积分 | 102 页 | 3.92 MB | 5 月前3
中国移动:云智算技术白皮书(2025)Packet Container 报文容器 18 DGSQ Dynamic Global Scheduling Queue 动态全局调度队列 19 OCS Optical Circuit Switch 光电交换机 20 AIGC Artificial Intelligence Generated Content 人工智能生成内容 21 MFU Model FLOPs Utilization 模型 FLOPs NVL72 超节点支持单机内 72 个 GPU 高速互联,重构全 球智能算力竞争格局,进一步拉大中美算力技术代差。为此,中国移动基于原创 COCA 异构计算架构 [1][2],联合 GPU 芯片、交换芯片、服务器整机等国产全产业链 伙伴,打造开放式架构大云磐石超节点,为大模型训练和推理提供更高吞吐、更 8 低时延的海量数据处理能力,推动解决国产智算核心“卡脖子”问题。 中国移动以统一开放互联的自主协议为基础,构建 面向近期,聚焦超节点生态构建和应用示范牵头打造,并推进行业形成跨 GPU 厂商兼容的互联标准,促进生态成熟。 面向中远期,以更高规模、更大带宽、更低时延的互联为构建目标,驱动国 产 GPU、交换芯片等核心器件的协同创新,加速产业体系升级。 2.1.3 算力原生 当前国内智算芯片生态碎片化,上层模型和应用向国产体系迁移难、意愿低, 不利于国产智算生态的良性发展。为此,中国移动携手产学研用合作伙伴,筑标0 积分 | 30 页 | 716.31 KB | 5 月前3
共 33 条
- 1
- 2
- 3
- 4
