2025年6G“零中断”网络设计白皮书-中移智库
2.50 MB
36 页
0 下载
3 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pdf | 3 |
| 概览 | ||
前 言 从5G商用化进程的加速到万物智联时代的开启,及物联网、工业互联网、 自动驾驶、远程医疗等新兴技术的蓬勃发展,人类对网络的需求不再局限于 基础连接,而是向极致可靠性、全域覆盖与智能自治能力迈进。当前 5G 网 络虽在时延和带宽性能上实现显著突破,但商用部署中仍暴露出多重短板与 潜在风险,部分关键场景存在业务中断隐患。 6G 作为下一代移动通信技术,对网络稳定性与可靠性提出了更高要求。 本白皮书聚焦核心网领域,汇聚行业专家的研究成果与实践经验,深度剖析 4/5G 商用网络事故带来的启示、前瞻性预判 6G 网络面临的可靠性挑战, 提出6G “零中断”网络(Zero-Outage Network, ZON)愿景和目标、设计“零 中断”网络三体架构,即网络本体原生抗毁、灾备护体物理止损、高稳智能体 智能提效,并论述6G可靠性设计的关键要素。致力于为人类社会提供永续在 线、无缝切换、自主愈合的通信服务,为业界同行提供参考,共同推动 6G 技 术发展,助力实现万物智联的美好未来。 II 1 1. 4/5G网络商用事故启示及6G可靠性挑战 2 1.1 4/5G 商用事故统计分析 随着 4G 和 5G 技术在全球范围内的商用推广,通信网络的规模和复杂性急剧 增长。近年来,全球通信网络中的重大故障事件也屡屡发生,给运营商和用户带 来了严重的影响。根据互联网公开数据和行业报告不完全统计,在 2021 年至 2024 年期间,全球通信行业发生了超过 66 起重大网络事故,影响范围广、恢复时间长、 经济损失严重。如何提高网络设备的容错性、提升整网抗信令风暴的鲁棒性以及 故障自愈的高效性是 6G 网络必须优先考虑和解决的问题。 图 1 2021年至2024年4/5G商用事故统计 事故诱因复杂,以网络故障和动网操作为主。4G/5G网络的故障呈现出软硬结 合、内外因交织的复合性特点。其中,网络故障占比约50%,通常由网络自身设 计缺陷或容灾不足引起网络中断,包括硬件故障、网络云故障、核心网故障、传 输承载故障等。其次,动网操作占比约38%,通常由人为的网络维护操作、或升 级调试等行为引发网络功能异常、甚至信令风暴和大面积服务中断。 过载是主要现象。占比约69%,通常因局域异常未能及时恢复或隔离,再加上 4/5G智能终端永远在线的设计,导致短时间内反复重试引发过载。 语音和数据业务会同时受影响。占比约88%,因语音和数据业务强耦合设计, 一方面语音业务都是基于IMS承载的,当数据业务发生故障,语音业务也将遭受 牵连;另一方面因为终端的语音优先策略,当语音业务故障时会释放数据连接。 事故诱因 事故现象 业务影响 中断时长 3 业务中断时间长。88%的事故中断时长超过2个小时,50%的事故中断时长超过 5个小时,主要因为发现异常耗时长、人工定界、诊断、恢复耗时长。 1.2 4/5G 商用事故启示 1.2.1 技术演进启示 5G网络在商用与能力演进过程中暴露出的问题和影响,要求在6G设计之初充 分考虑并规避。 降低网络复杂度,减少故障风险和定位时长:5G网元和接口数量增加, 长链路交互增加了故障诊断/定位的耗时和难度,当网络信令风暴发生 后需要E2E协同控制才能有效恢复。 降低资源池故障的跨层传导,做好亚健康监控和容错设计:5G网络在 虚拟化改造后,采用资源池、通用硬件替代传统的通信专用硬件,亚健 康故障检测和定位定界难度增加,三层兼容性问题增加,对网络可靠性 带来挑战。需通过通用硬件层的高可用设计、基础软件层的稳定运行及 业务软件层的容错机制协同保障,实现系统级可靠性,确保服务持续稳 定。 加固枢纽节点应灾能力,减少服务化信令冲击:NRF、SCP作为5G服务 化、信令转发的中枢节点,一旦故障影响较大。随着网络规模的扩大以 及用户量的扩增,服务化接口信令冲击、大包传输、链路层资源不足的 风险相应增加。 加强边缘网隔离性,减少和公网相互影响:边缘网络与公网可能存在控 制面交互、数据同步,一旦发生链路异常或传输异常,影响边缘业务的 4 正常运行,同时,边缘网络访问公网也存在安全攻击风险和故障传导风 险。 提升网络敏捷拓展能力,保持基础网络的稳定性:随着3GPP标准的不 断更新,许多新业务拓展常需多个基础网元升级,业务发展不敏捷,也 波及已商用业务的在线体验和基础网络的稳定运行。 1.2.2 容灾管理启示 容灾组网的完善程度直接决定了网络在面对灾难或突发故障时的恢复能力。 当前许多网络在面临大规模故障时,无法保证服务的连续性,恢复过程缓慢。 做好基础容灾备份,避免二次危机:部分运营商因缺少冗余设计,导致 灾难发生时业务无法平滑迁移至备用路径或系统,短时信令冲击引发二 次危机,故障影响范围持续扩大、定位复杂度进一步增加,恢复时间延 长。 做好风险化解,避免大面积瘫痪故障:数据网元(例如UDM、HSS)作 为移动通信网核心所在,该设备的故障将引发超大规模的用户重注册、 进而引起信令风暴,需要考虑相应机制分担数据网元故障后的风险与压 力。 做好动网预演,避免操作不当带来风险:部分事故是由于管理机制不完 善,在网络升级改造、调整维护时缺少预演预验证手段,导致一些误操 作的风险不可提前预估与防范。 重塑打底逃生网,弥补2G退网后的不足:2G低制式网络虽然技术落后, 但其是4/5G网络天生的兜底平面,为基础通信需求提供了最后一道屏 5 障保护。随着2G的退网,这一天然屏障将丧失。6G网络需要考虑相应 机制和4/5G网络形成新形态的高低制式间的互补与兜底。 1.3 6G 网络可靠性挑战分析 6G网络将覆盖更广泛的应用场景,赋能多行业、多领域的智能化服务。ITU-R 在2023年明确了6G六大核心场景,包括沉浸式通信、超大规模连接、极高可靠低 时延、感知与通信的融合、人工智能与通信、泛在连接。这些新场景普遍要求网 络提供更高稳定性,同时对网络可靠性也提出一些新挑战。 图 2 ITU 定义 6G 六大核心场景 1.3.1 人工智能与通信,智能与可靠的博弈 AI 与 6G 通信的深度融合在提升网络能力的同时,也引入多重可靠性风险。 AI 模型对数据质量高度依赖,数据偏差可能导致故障预测失准或资源调度失效; 模型黑箱特性使决策过程难以追溯,关键场景下故障定位与修复效率受限;AI 系 统面临数据污染、模型攻击等安全威胁,可能引发错误决策或网络异常;此外, AI 驱动的核心网依赖稳定算力支撑,算力资源故障将直接影响智能功能运行。这 6 些挑战要求 6G 网络在 AI 模型鲁棒性、决策透明性、系统安全性及算力可靠性 等方面强化设计,平衡智能化与可靠性的技术演进。 1.3.2 智能体通信,新型模型和实时组网需要动态保障 在6G 网络中,AI Agent 将随着技术的快速发展而得到广泛应用,带来全新 可靠性挑战。智能体基于环境自主学习的特性,使其行为模式难以预测,导致网 络设备动态调度结果的不确定性增加,传统流量管理模型失效;智能体通信以 AI 模型、原始数据等机器媒体为主,传输需求更复杂(如持续低延迟交互、高度并 行通信),颠覆了传统人类通信的流量模式,对网络带宽动态适配与话务冲击应 对提出更高要求;机器人集群、自动驾驶车队等场景依赖 P2P 动态组网,需实 时组建协作网络并共享环境信息,现有网络的静态子网管理与路由机制难以满足 动态协同需求,亟需提升网络动态组网与智能调度能力以保障业务可靠性。 1.3.3 超大规模连接,瞬时信令冲击加倍 6G 超大规模连接场景下,海量物联设备接入(每平方千米可达百万至亿级) 对网络可靠性形成多重挑战。终端规模百倍于 5G 时代,网络异常恢复时的大规 模重连易引发信令风暴,远超现有网络抗 “浪涌” 能力;终端种类繁多导致行为 难以预估,异常信令与安全攻击风险显著提升;传统 “踢用户下线” 的容灾手段 因部分终端不具备自动上线能力而失效,亟需创新流量控制与容灾策略,保障网 络在超密集连接下的稳定性。 1.3.4 沉浸式通信,提出更高连续性和稳定性要求 7 6G 沉浸式通信聚焦 “体验保障”,面向 VR/AR、远程协作等场景,对网络可 靠性提出多维挑战。多模态数据传输要求音视频、触觉等数据流实现毫秒级超低 时延与精准同步,避免交互失真;通信、算力、AI 等资源需实时协同,任一环节 异常均可能导致业务中断,亟需建立跨维容灾接管机制;用户移动时,边缘算力 与网络会话需在毫秒级内完成无缝迁移,对网络动态资源调度、智能切换能力提 出严苛要求。现有网络架构难以满足沉浸式业务对连续性与稳定性的需求。 8 2. 6G“零中断”网络愿景和目标 9 2.1 愿景和目标 为了体系性的构建高可靠的6G网络,中国移动提出“零中断”网络这一全新设 计理念,其核心愿景是“运行态的网络长稳服务、应灾态的业务零损保障”。它表 达两层含义,一是在网络设计、建设和运维的每一个环节,都尽可能地减少故障 发生的可能性;二是在故障发生的第一时间,能够以最快的速度恢复服务。 零中断网络的目标可以分解为以下四个方面,采用不同技术逐步达成。 (1) 日常运行主动预防。在日常运行时主动采取有效措施提前发现和预防,包 括风险预见和动网拦截,如版本升级、网络扩展、日常维护等动网操作时, 不影响基础网络稳定运行以及业务的正常体验。 (2) 常规异常快速自愈。在网络发生设备亚健康、信令冲击、网元故障、服务 器故障、链路故障等常规异常时,网络能够自我感知和自我修复,保障用 户不下线、业务快恢复、用户无感知、数据零丢失、故障最小隔离等。 (3) 极端异常兜底保障。在网络发生主备资源池异常、传输承载故障、多系统 异常、停电或自然灾害等极端异常时,网络能够逃生到应急网络或自主运 行,保障高优先级用户的基础通信服务,同时可提供有效的故障定位、隔 离、恢复手段,避免完全不可用以及长时间不能恢复等重大事故。 (4) 极致业务绝对保障。针对工控医疗等涉及人身安全和生产制造的特殊业务, 网络能够端到端管理协同应对各类异常场景,提供“绝对的零中断、低延时、 确定性”保障。 2.2 设计理念 基于4/5G商用网络故障启示、6G网络的新增挑战、及6G零中断网络目标,建 10 议6G零中断网络设计兼顾系统性和时效性两个方面。 1、系统性,指的是从全层级、全场景和全时空三个层面系统考虑。其中“全 层级”聚焦网络的各个层面主动设计防护,旨在从源头降低故障发生;“全场景”聚 焦各类异常场景针对性设计,旨在异常发生后能够有效恢复;“全时空”聚焦越来 越复杂的网络环境开展端到端防护,旨在精准定界快速恢复。 2、时效性,指的是“早预防、早干预、早隔离、早恢复”,旨在从异常产生到 恢复,全方位提高异常处理的效率,缩短业务中断时长。 2.3 总体架构 基于零中断网络的愿景、目标和设计理念,面向核心网领域,从网络本体、 灾备护体、高稳智能体这“三体”出发构建零中断网络总体架构,以实现网络全层 级、全场景、全时空的业务保障和不间断运行。 11 图 3 6G“零中断”网络总体架构 1、夯实网络本体,在架构和功能设计阶段秉承内生高可靠设计,降低故障发 生可能。网络本体犹如战士自身,技能过硬是根本。网络本体包括网络架构、网 络功能、信令网、网络云等各层级,是故障发生的起点和故障修复的落脚点,应 秉承高可靠内生设计,降低问题发生的概率、提升网络韧性、增强信令冲击防控 能力,构建稳健、敏捷、易扩展、易隔离、易恢复的基础网络。 2、完善灾备护体,主动预防、快速恢复、兜底保障多措并举,全方位保障网 络稳定。灾备护体犹如战士的铠甲盾牌和急救包,防护与急救缺一不可,包括孪 生平面、容灾平面和逃生平面。通过孪生平面实现异常发生前主动预防和拦截、 12 通过容灾平面实现异常发生后有效接管、快速恢复,通过逃生平面实现传输异常、 资源池异常、自然灾害或大面积停电等极端情况下的兜底逃生和应急保障。 3、引入高稳智能体,域内自治自愈、跨域协同容灾、AI风险防控点面结合, 根本上提升异常处理效率和精准度、提升跨域协同容灾能力。高稳智能体犹如科 技武装和作战指挥,面向6G 多网并存、多域协同、多维融合及智能体通信的复 杂性,引入智能化手段替代以人为主、单点排障的传统运管模式。同时,需要增 加“AI风险防控”有效评估和拦截智能化本身引入的风险。 此外,建立网络可靠性评价体系,形成闭环反馈也至关重要。网络可靠性评 价体系犹如全面的作战能力评估体系,既能直观的反应系统整体可靠性级别,包 括主动防御能力、基础设施持续运行能力、关键领域支撑能力、风险应急能力等, 也能通过可靠性相关指标见到不足和短板,持续优化改进,对可靠性体系形成闭 环反馈,实现持续改进的零中断目标。 13 3. 6G“零中断”网络设计要素 14 3.1网络本体原生抗毁 3.1.1 网络架构高可靠 可靠的网络架构是 6G 多样业务灵活发展、基础网络稳定运行的核心前提。 面对车联网自动驾驶、工业实时控制等极致可靠性需求,以及分布式架构复杂度 提升、异构技术融合带来的风险,需以分布式无状态、网络简化、边缘自治为核 心设计原则,通过解耦功能与状态、精简层级交互、增强边缘自主性,构建抗毁 性强、扩展灵活的高可靠架构。 分布式无状态秒恢复:通过分布式架构实现功能节点的弹性扩展与异地 协同,依托网络云技术将计算资源动态调度至流量热点,应对业务浪涌 时资源利用率提升 30% 以上;通过无状态设计解耦功能节点与状态数据, 状态数据独立存储保障永不丢失,功能节点故障时业务可瞬时切换至健 康节点,实现会话零中断迁移与毫秒级恢复。两者结合使 6G 可用性达 99.99999%,同时支持热升级与灰度发布,新功能上线周期缩短超 60%, 兼顾可靠性与演进灵活性。 网络简化降复杂度:精简网络层级与网元数量、服务数量,压缩传统多 级转发链路,减少中间交互环节,减少故障点、降低故障传导风险,提 升信令交互效率、提升故障定位效率,从架构源头构建低复杂度、高鲁 棒性的网络基底。 边缘自治保连续:赋予边缘节点本地化智能决策引擎,集成实时数据处 理模块与分布式存储能力,可在边缘侧独立完成 80% 以上的本地业务处 理。当核心链路或传输中断时,边缘节点自动切换至自治运行模式,通 过边缘间协同路由实现业务迂回,保障关键数据不丢失、实时业务不中 15 断。结合边缘节点的轻量化故障自愈机制,提升网络抗毁韧性,有效降 低对核心网的依赖风险。 3.1.2 网络功能高可靠 随着 6G 网络技术融合与业务复杂化,业务功能的可靠性短板凸显。4/5G 现 有容灾机制难应对 AI 风险和固有的功能耦合依赖性,无法满足 6G 零中断需求。 为此,6G 网络功能可靠性设计以 “抗风险、强容错、控过载” 为目标,通过弱依 赖低耦合、强容错高兼容、流量治理三大策略,提升复杂场景下的稳定性与抗冲 击能力,筑牢 6G 发展根基。 弱依赖低耦合,构建抗风险弹性:在 6G 多元技术融合与动态网络环境 中,通过弱化组件依赖、解耦功能模块提升网络抗风险能力,包括:1) AI 弱依赖,秉持 “可用可控” 原则,将 AI 作为可加载、可卸载的独立 模块,确保其失效时不影响基础网络功能运行,且可以独立迭代更新。2) 网络云弱依赖,通过上层应用与网络云虚拟层、底层资源解耦设计,实 现三层独立演进、软/硬件升级时业务无感迁移,多网元共用资源场景下 通过异常隔离机制防止故障传导。3)业务低耦合,解决当前数据和语音 业务依赖问题,确保语音、数据、物联网等业务能独立运行和演进,单 一业务异常不波及其他;4)服务低耦合,各类网络功能服务应相对独立 解耦设计,能够被独立调用、加载卸载、升级扩展、故障修复,在任意 服务异常的情况下,其他服务能够正常运行。 强容错高兼容,强化异常场景应对能力:针对 4/5G 冗余机制局限性与 服务化接口兼容性问题,6G 通过多层级提升可靠性设计,包括:1)网 络功能容错,是指在用户签约数据、策略管理等核心功能主备资源均失 效时,能够快速感知异常、及时触发替代方案,保障业务持续可用;2) 16 信令转发容错,是指区分物理层、协议层、应用层分别制定异常判定和 恢复机制,物理层实时监测链路质量,协议层智能识别异常类型,应用 层动态选择容灾策略,确保主备链路全故障时业务不中断。3)服务接口 兼容,包括接口参数、协议版本兼容设计及灵活扩展机制,支持不同场 景下的服务快速适配与部署,降低接口交互风险。 流量治理与优先级保障,端到端治理过载风险:针对核心网过载引发的 信令风暴与故障升级问题,6G 从信令优化、冲击缓冲、动态治理三方面 强化流量管控。1)信令优化,通过智能重发退避、心跳周期协调及周期 性信令分散算法,从源头减少无效信令冲击;2)冲击缓冲,通过用户上 下文存储、分级唤醒策略避免故障后用户扎堆上线引发的瞬时过载,并 按业务优先级(如语音、急救)分阶段恢复服务。3)动态治理,通过整 合信令监控、负载均衡、动态限流、过载熔断等机制,实现潜在风险实 时干预、流量负载智能调度、故障扩散有效阻断,构建全流程过载防护 链。 3.1.3 信令网高可靠 信令网是 6G 网络信令转发的关键锚点,承担信令转发、跨域互通及异网隔 离等功能。其可靠性直接影响全业务链连续性,分布式架构下需应对复杂路由与 多元业务需求。通过动态路由自适应、边界隔离防护、负载均衡优化等机制,可 提升信令网稳定性,保障 6G 信令传输高效可靠。 动态路由自适应,应对复杂网络的智能路径优化:建立信令链路与节点 状态实时监测体系,依据链路质量、网络负载及业务需求变化,自动调 整信令路由策略。当链路故障或拥塞时,快速切换至备用路径,实现路 17 由动态优化,确保信令沿最优路径传输,减少传输延迟与丢包,增强信 令网对复杂网络环境的适应能力。 边界隔离防传导,构建多层级信令域隔离屏障:采用虚拟路由转发等技 术划分信令路由域,实现业务隔离与独立运行,阻断故障与攻击的跨域 传播。为关键业务定制专属信令通道,设置严格的访问控制规则,保障 核心业务信令传输安全稳定,降低外部因素对信令网核心功能的干扰。 智能LC/OC防过载,流量分级管控的可靠性保障:设计智能负载均衡方 案,将信令流量合理分配至多条可用路径,避免单一路由节点或链路过 载。实时监控信令负载情况,当出现过载风险时,依据业务优先级对低 优先级信令进行限流或调度,优先保障核心业务信令畅通,维持信令网 整体运行可靠性。 3.1.4 网络云高可靠性 网络云是整合计算、存储、网络资源的云网融合基础设施,需在复杂业务场 景与持续演进中保障稳定性,以支撑上层应用灵活发展。可以从资源弹性与故障 隔离、分布式一致性与假活防护、平滑演进与兼容性架构三方面构建高可靠的网 络云基础设施。 资源弹性与故障隔离设计:构建动态资源池化体系,通过容器化 / 虚拟 化技术实现计算、存储资源的弹性分配与跨节点迁移。当节点发生硬件 故障或软件异常时,自动触发资源隔离机制,将业务流量实时迁移至健 康节点,避免故障扩散影响上层应用。同时,预设 10%-20% 热备资源池, 应对突发流量或
| ||
下载文档到本地,方便使用
共 36 页, 还有
1 页可预览,
继续阅读
文档评分


医院网络设计方案