智算无界:AIDC的超越和重构-上海贝尔大模型训练依赖数千甚至数万张GPU的协同计算,例如Llama3-70B模型在1024个GPU上训练时,单 epoch产生的网络流量高达85EB。传统数据中心网络难以承载如此庞大的东西向流量,导致网络拓扑设计复 杂度呈指数级上升。组网规模的扩大还引发了负载均衡难题,传统ECMP(等价多路径路由)算法在“少流 大流”场景下易引发链路拥塞,使网络有效吞吐量骤降至理论值的10%-60%。 超高带宽与低时延需求 量调度以及端网协同等机制,以及硬件低时延(交换机、RDMA网卡)和直连拓扑等技术,降低端 到端的静态时延(转发及传输)和动态时延(拥塞、排队和重传等)。 • 带宽需求:单端口带宽需支持400Gbps以上,向800G及1.6T演进,节点间总带宽需与GPU数量成 正比,例如万卡集群需数百Tbps级网络容量。 确定性负载均衡 • 全局路由优化:通过网络级负载均衡等技术,基于拓扑信息实现确定性路径分配,避免传统ECMP的 容错机制:采用多路径冗余设计,确保单链路故障时训练任务可无缝切换至备用路径。 高可扩展性与灵活性 • 拓扑创新:从传统Spine-Leaf架构向Dragonfly、3D Torus等新型拓扑演进,提升网络带宽、降低 时延并增强可扩展性。 • 光电融合交换:引入光交换技术,将波长作为调度单元,降低时延并提升带宽利用率,并支持训练 任务的动态拓扑重构,简化网络的增量扩展。 智能化运维与管理 • 自动化部署:基于意图和10 积分 | 38 页 | 9.31 MB | 22 天前3
2025AI供电的未来:重新定义AI 数据中心供电白皮书-英飞凌V。凭借 CoolSiC ™ JFET 技术出 色的热稳定性,可在安全工作区(SOA)内,实现较长时间范围(超过一秒)的线性工作。结果如图 5 所示。 9 图 6:800 V → 12 V 转换器的拓扑结构和布局示意图 在该设计中,磁芯被分成两个对称部分。所有初级和次级 MOSFET 均布置在板顶,以降低液冷热阻。测试结果显示, 峰值效率高达 97.4%,满载效率为 96.6%,性能优异。图 7 EiceDriver ™栅极驱动器负责提供 PWM 和驱动信号。 图 6 展示了该 800 V → 12 V 转换器的拓扑结构与布局。 10 图 7:输入电压为 800V 时,800 V → 12 V 电源转换器的效率测试结果 图 8:800 V → 50 V 转换器的拓扑结构和布局 800 V → 50 V → 6 V 功率转换 除了上述 800 V → 12 V 方案(需要将高压 IBC 800 V → 50 V 转换器的拓扑结构和布局。 11 图 9:800 V → 50 V 转换器的 3 千瓦模块的效率测试结果 图 10:额定功率为 1 千瓦、8:1 转换比的中间总线转换模块的效率测试结果 堆叠式 LLC 变换级在谐振频率下工作,峰值效率高达 98.5%。 随后,中压 IBC 将电压进一步降至 6 V。我们采用混合开关电容转换(HSC)拓扑结构,结合磁能与电容能量传递,10 积分 | 24 页 | 14.75 MB | 22 天前3
面向数字孪生流域建设的洪涝模拟解决方案(42页 PPT)倍。 耦合物理机制的深度学习: 产汇流机制约束的深度学习洪水预报模 型 技术成果: 提高模拟精 度 P18 在各类规划规程调度的基础上 ,根据工程调度的需求 ,在流域水利工 程 调度拓扑关系图上 ,针对调度对象和目标 ,可进一步优化水库水闸的 调度方式 不同控制单元 P19 各种水力特性单元开展数值模拟 , 完整反应洪水调度的物理过程 技术成果: 提高模拟精 度 调度模型精细化模 ,基于前处理模块形成的水工程、汇水单元、河网拓扑结构等基础信息 ,确定工 程 调度模型范围 ,以拖拽、链接等绘制或自动生成等方式 ,通过组件的组合和链接 ,形成流域或区域的水 系程拓扑关系图 ,为后续通用调度模型的构建提供数据底板。 水库 水闸 控制断面 技术成果: 提升建模效 率 水系与工程拓扑关系解析与自动生 成 新建流域水系和工程拓扑关系 拓扑关系自动化生成 拓扑关系自动化生成 和水利工 P24 积木装配式调度模型建模 基于系统连通拓扑关系和通用化标准化模块 ,研发模型自组装技术 ,实现复杂防洪系统装配式建模, 提高建模效率、 自动化和智能化水平 技术成果: 提升建模效 率 复杂防洪系统调度模型库与装配式建模技术 P25 模型高效求解: 并行优化算法 结合二维有限控制体积计算的加速方法 ,与基于 CPU 和 GPU 耦合并行加速技术的一二维耦合10 积分 | 42 页 | 7.73 MB | 22 天前3
2025年算力运维体系技术白皮书-中国信通服务整理;对于存储网络问题,优化网络拓扑结构、升级网络设备等;对于存储设 备老化,考虑适时更换新设备。同时,采用缓存技术、RAID 优化等手段提升 存储设备性能。例如,增加存储设备的缓存容量,可以减少磁盘 I/O 操作,提 高数据读写速度;合理配置 RAID 级别,在保障数据安全性的同时,提升存储 性能。 2.2.7 网络设备运维 2.2.7.1 网络拓扑管理与优化: (1). 清晰的网络拓扑结构是保障网络稳定运行的基础。通过网络拓扑发现工具, 清晰的网络拓扑结构是保障网络稳定运行的基础。通过网络拓扑发现工具, 自动发现并绘制网络拓扑图,实时展示网络设备(如路由器、交换机、防火墙 等)之间的连接关系。定期对网络拓扑进行梳理和优化,根据业务发展需求, 调整网络设备的部署位置和连接方式。例如,当数据中心新增业务区域时,合 算力运维体系技术白皮书 - 17 - 理规划网络布线,将新的网络设备接入现有网络拓扑,确保网络连接的合理性 和高效性。 (2). 优化 优化网络路由策略,根据网络流量分布情况,合理设置路由优先级和路径, 避免网络拥塞。采用动态路由协议(如 OSPF、BGP 等),让网络设备能够自动 学习和更新网络路由信息,提高网络的自适应能力。同时,对网络拓扑进行冗 余设计,在关键节点采用双链路或多链路连接,当某条链路出现故障时,网络 流量能够自动切换到备用链路,保障网络的可靠性。 2.2.7.2 网络流量监测与分析: (1). 借助网络流量监测10 积分 | 74 页 | 1.36 MB | 22 天前3
新型电力系统电力扰动及其数据分析应用(29页PPT-四川大学2025)1474MW 124 学 = 划 新 庭 在 次 自 e 术语 定义 测量 特征 评估 诊断 治理 关注电能质量本身 的诊断与抑制 电源 电网 响应 拓扑 负荷 故障 态势 特性 诊断 推演 预测 协同 控制 调控 挖掘与扰动相关联的 设备级 - 系统级信息 不断涌现的复杂扰动模式难以 定义和表征。 监测数据中蕴含的系统级、设 同源检测 ③ 特征融合的 DG 控 制 参数辨识 ③ 暂降幅值分区并行 迭 代评估 ③ 脱网时序估计的多 ① 电压暂降事件映射 规则挖掘 ①DG 控制参数对暂 降 的影响规律 ① 配网拓扑多阶段自 动分区 ①DG 随机出力场景生 成 ② 电压暂降波形相似 性度量 ② 暂降波形的显 / 隐 式 特征构建 ② 基于节点撕裂的短 路电流计算 ② 电压暂降二维特征 联合计算 Thosiln · 难点 1: 传播中波形特征显著变化 · 难点 2: 对时误差导致事件时标不可信 难点 3: 拓扑与元件信息并不总能获 取 编号 类型 编号 类型 Dc 58 De 77 Dc 7720 积分 | 29 页 | 10.63 MB | 22 天前3
2025汽车零部件智能工厂咨询项目解决方案(35页 PPT)用) HMI 工具 应用服务器 交换机堆栈 补丁管理 终端服务 应用镜像 服务器 单元组 / 区域 #1 (冗余星形拓扑) 驱动 控制器 HMI 分布式 I/O 控制器 驱动 驱动 HMI 分布式 I/O HMI 单元组 / 区域 #3 (线性拓扑) 第 2 层接入交换机 控制器 企业 /IT 集成 协作 无线 应用程序优化 单元组 / 区域区 第 0–2 级 隔离区 (DMZ) 防火墙 企业网络 第 4–5 级 Web 应用 DNS FTP 互联网 无线传感器 无线传感器 无线传感器 HMI 工具 客户端 单元组 / 区域 #2 (环形拓扑) 私有云规划 平伟用户 基础设施即服务 (IaaS) 平台即服务 (PaaS) 软件即服务 (SaaS) / 应用系统 用户 / 管理门户 报告和分析 服务管理和监控 分析工具 分析工具10 积分 | 35 页 | 6.40 MB | 22 天前3
中移智库:2025年任务驱动式智能互联技术白皮书定的 QoS,完成特定任务的 专属计费等操作。 因任务加入了智能群组后,智能群组可为各类终端提供单播、广播、组播类通讯能力,并支持群组 内终端设备、特定业务之间彼此相互发现,自动形成最优的转发拓扑。 智能群组也具备智能化终端管理能力,智能群组中,网络提供 TDS 智能体,与智能化终端之间完成 意图交流,并基于意图进一步推动任务分解,任务执行,细化和完善群组子网的调整和运营。 在智能群组中,TDS 互通的基础。 接下来,TDS 将持续跟踪,感知每个终端的变化,并维护复杂多变的智能群组子网拓扑。在动态多 变的拓扑中,始终维持着每一条业务路径的传输质量,使其保持最佳的业务体验,与此同时,持续 面对终端的加入、退出、聚集到热点区、进入弱覆盖区、进入异构无线覆盖区等等事件,为突发事 件提供及时的拓扑调整,资源竞争应对等手段。这些都要求 TDS 具备充足的智慧。为此,TDS 将引 入了智能辅10 积分 | 25 页 | 4.54 MB | 22 天前3
某企业级省大数据平台工程建设方案(636页 WORD).....................................................................................617 5.6.5 系统网络拓扑......................................................................................618 6. 项目管理与工程建设 编译器在驱动程序接收到一个 HiveQL 语句时被调用。编译器将该语句 编译成 mapreduce 作业主动管理中的一个计划。 该驱动程序从主动管理器提交单独的 map-reduce 作业到一个拓扑秩序 中的驱动引擎。Hive 目前使用 Hadoop 作为它的驱动引擎。 4.2.1.3 MAPREDUCE 分布式计算 Hadoop 中的 MapReduce 是一个使用简易的软件框架,基于它写出来的 而应用逻辑可以表达为一系列转换处理。 通常应用逻辑是以一系列 TRANSFORMATION 和 ACTION 来表达的。前者 在 RDD 之间指定处理的相互依赖关系 DAG,后者指定输出的形式。调度程序 通过拓扑排序来决定 DAG 执行的顺序,追踪最源头的节点或者代表缓存 RDD 的节点。 Spark 中 的 依 赖 性 主 要 体 现 为 两 种 形 式 , 宽 与 窄 ( Narrow dependency,Wide30 积分 | 973 页 | 40.66 MB | 22 天前3
智慧社区解决方案(253页 WORD)......................................................................11 第 i 页 智慧社区解决方案 3.2 系统拓扑................................................................................................... 归纳总结业务共性, 设计出包含名单比对,事件联动,业绩考核,社区三巡,信息管理等模块,并 对接社区运营系统,第三方管理系统,物业管理系统,形成数据/业务闭环。 图1 应用架构图 3.2 系统拓扑 智慧社区系统采用组件架构,每个组件承担不同能力,从能力上分为共性 业务组件、通用服务组件、基础环境组件。 业务整体分为:社区管理中心、视频监控业务、一卡通业务、车辆管控业 务、报警检测业务 各类探测传感器、控制主机;传输网络可以是公共电话交换网(PSTN)、无线 信道(CDMA/GSM)、Internet 网络等;接警中心(物业中心/门岗)则由接 警管理计算机以及相应软件等组成。 整体系统的拓扑分布如下: 图70 入侵报警子系统拓扑图 7.2.1.1 前端报警设计 社区报警点设计原则 可靠性原则 社区联网报警系统是一个长期运行的系统,保证系统稳定可靠的运行是首 先要考虑的。设计时要充分考虑后备以及灾难恢复系统,使系统在部分故障时20 积分 | 395 页 | 35.13 MB | 22 天前3
某市禁毒大数据平台建设方案(69页 WORD)......................................................................................12 3.1.2 总体网络拓扑图.................................................................................................. 供数据和资源支撑,各业务应用以应用表现层为载体对用户提供可视化界面进 行操作,公安内网使用 bs 架构模式,在用户认证端使用公安部统一数字证书认 证登录。 20 3.1.2 总体网络拓扑图 平台的网络拓扑架构如下图,内网和互联网分别有应用和数据库,在互联 网使端为保证数据的安全性使用脱敏数据库,不存储涉密信息,互联网 web 服 务器主要是提供数据接口给吸毒人员 app 客户端和企业公众号使用。内网和互10 积分 | 91 页 | 5.26 MB | 22 天前3
共 21 条
- 1
- 2
- 3
