未来网络发展大会:算力城域网白皮书(2025版)识 推断提供高效准确结论的过程。 对于大部分企业和研究机构来说,自行购买和维护高性能计算设 备训练大模型需要投入大量的人力和物力。在这个背景下,算力租赁 服务应运而生。算力租赁通过即插即用的弹性解决方案,降低了算力 获取难度和使用成本。企业的信息化和智能化转型可以通过算力租赁 更快捷地获取所需的算力资源,从而加速技术研发和创新。当前,算 力租赁服务已成为主流解决方案,不仅降低了算力使用的门槛,推动 面对算力产业快速发展趋势,中国电信推出了面向智算的新一代 数据中心(AIDC,Artificial Intelligence Data Center)基础设施技术方 案,在高算力规模、高功率密度、高弹性需求背景下,同时兼容通算、 超算、智算,甚至未来的量子算力。在 AIDC 基础上,中国电信积极 布局算力基础设施建设,面向政府、企业、科研机构等提供就近的高 效算力服务。除了围绕热点区域建设“2+3+7”1的公共智算云池,还 向算力业务的长期演进,中国电信通过引入算力灵活调度、算力无损 传输、精准流级调度、网络智能运维等能力,打造以算力为中心、算 网一体的城域网新业态——算力城域网2。当前,中国电信在上海、 浙江、广东等地围绕海量数据弹性高效入算、存算分离百公里拉远训 练、百公里分布式推理等新型智算业务开展算力城域网现网验证,实 1 “2”是指中国电信在内蒙古、贵州设置的两大公共训练智算中心;“3”是指中国电信在北京、上海、 广州设置的三大热点区域智算中心;“720 积分 | 42 页 | 7.16 MB | 1 天前3
未来网络发展大会:2025分布式算力感知与调度技术白皮书发改委等部门推动的“东数西算”工程,核心目标并非简单的“数据 西迁”,而是构建全国一体化的算力网络体系。推动该技术发展,能 将地理上广域分布、架构上高度异构、权责上分属多域的海量算力资 源,通过智能化感知与调度,整合成逻辑统一、弹性敏捷、安全可控 的国家级“算力资源池”。这不仅从根本上解决我国东西部算力供需 不平衡的结构性矛盾,更能通过统一调度形成规模效应,为国家重大 科研项目、经济社会发展提供澎湃且经济的算力支撑,从而在全球数 配至最优算力节点。 资源管理功能:对分布式算力资源进行统一管理,涵盖资源注册、 注销、状态监控、故障诊断等全生命周期管理。通过资源虚拟化与池 化技术,将分散的物理资源整合为逻辑资源池,实现资源的灵活分配 与弹性扩展。例如,利用 GPU 虚拟化技术(MIG、vGPU)将单块 GPU 18 切分为多个虚拟实例,供不同任务共享使用;通过智能算力池化,对 CPU、GPU 等资源进行统一调度,降低资源碎片化,提升资源整体利 基础设施层作为分布式算力感知与调度体系的资源支撑底座,面 向多源异构算力与多样化网络环境,提供统一接入、抽象管理与弹性 供给能力。该层涵盖从边缘到核心的数据中心资源,包括适配弱网环 境的边缘节点、具备单向通信能力的安全隔离网络、广覆盖的运营商 通信网络、集团、省、市各级数据中心与算力网关,支撑资源的分级 部署、异构接入与高弹性调度,构建覆盖广泛、能力多样的算力资源 基础。 (2)网关管理层 25 网关管理层20 积分 | 73 页 | 2.15 MB | 1 天前3
未来网络发展大会:2025算电协同技术白皮书在边缘节点部署智能代理模块,实现算力资源的状态感知、自主注册、 动态调控与异常恢复,降低系统整体运维复杂度,增强纳管系统的可 扩展性与鲁棒性。 多元异构资源适配纳管体系的建立,不仅提升了资源统一管理的 效率,也为实现弹性算力提供了必要前提,构筑算电协同系统的算力 基础设施底座。 2.2.2 多能互补电力协同调度 算电协同的本质,是算力系统对电力系统的深度感知、动态响应 与反向驱动。在以可再生能源为主体的新型电力系统中, 区块链技术为算电资源交易构建了“可信账本+自动履约+多方协 第九届未来网络发展大会白皮书 算电协同技术白皮书 25 作”的数字信任基础。未来,基于可信交易机制的算电协同系统将具 备更高的市场弹性、更强的资源流通效率以及更优的绿色发展能力, 成为数字经济与绿色能源深度融合的重要支点。 第九届未来网络发展大会白皮书 算电协同技术白皮书 26 三、算电协同典型应用场景 “算随电调”模式的有效运作离不开关键支撑技术。新能源出力 预测系统基于 AI 模型,结合气象数据提前预测风光出力,为算力调 度提供时间窗口;算力任务分级机制将任务分为实时性、延迟容忍和 弹性三类,便于根据电力情况进行调度;电算协同调度平台整合各类 数据,通过优化算法实时输出调度指令,实现电力与算力的协同。 该应用场景取得了显著的效果,新能源消纳率大幅提升,风光弃 电率从原 3%10 积分 | 66 页 | 1.70 MB | 1 天前3
新华网&腾讯云:2025年国产数字化升级标杆实践报告国产数字化升级标杆实践报告 国产数字化升级标杆实践报告 09 - 国产化的根基在于底层基础设施的自主创新。实践表明,成熟的国产底座不仅能够完全胜任大规模、高并发的业务场景,更能提供灵 活的弹性扩展能力和开放兼容、一云多芯的生态支持。 在政务领域,广东省政数局基于腾讯云专有云TCE打造了全国最大的省级政务云,覆盖IaaS、PaaS、安全全栈云平台服务能力, 服务68个省级单位、1000 边缘计算Edge 镜像仓库Registry 离在线混部 应用市场Apps 高性能网络eBPF GPU虚拟化qGPU 应用编排TAD/Helm 容器运行时Runtime 存储管理PVC/PV 弹性伸缩HPA 集群管理Kuberetes 负载均衡LB 消息中间件 消息队列 RabbitMQ版 消息队列 RocketMQ版 消息队列 CKafka版 消息队列 Pulsar版 数据库与存储 故障秒级切换,平台经过腾讯内部95%业 务实践验证,支持同城双活以及多地容灾, 系统可用性高达99.999%;同时提供5A数 据安全保障,支持国密数据存储。 提供开箱即用的极速启动体验,支持弹性扩 缩容,灵活适配业务增长需求;通过AI加持 的智能运维能力,结合运维知识库与系统运 行指标,实现故障事前预警、自愈和事后根 因分析,有效降低综合运维成本。 性能卓越 智能运维 支持单项目10万+节点,单集群万节点的超20 积分 | 45 页 | 20.65 MB | 1 天前3
2025年智能化时代数据库自主可靠运维白皮书-腾讯云就架构设计来看,TDSQL采用模块化分层设计,支持多引擎兼容、智能运维管理及高可用性服务。 其核心架构由TDSQL管理平台及TDSQL引擎组成,各模块通过标准化接口协同工作,提供安全、 稳定、弹性的数据库服务。 提供多样化的用户接入方式,可灵活对接业务,统一调度资源与权限,保障系统安全与高效运行, 同时支持全链路监控、故障自愈与性能优化。 腾讯云数据库TDSQL架构设计 �� Web 。 此设计的优势在于,通过TDSQL的DCN同步模块,在保持主备机房物理隔离的前提下,实现了数 据同步的自动化、高可用化与业务扩展性,有效满足企业级应用对跨地域数据一致性、故障自愈 能力及资源弹性扩展的核心需求。 主从复制架构优势: �)基础参数对齐 主备集群创建实例时,应确保主、备实例的数据库版本、字符集编码、排序规则、大小写敏感、 innodb_page_size 等参数项一致。 通过上述全链路监控体系,可形成从底层协调到上层集成的立体化监控能力,是数据库稳定运 行、快速进行故障响应的基本保障,也是进行资源调配与合规审计的关键性技术支柱。 在数据库运维的全生命周期中,资源管理是支撑系统稳定、弹性、低成本运行的核心底座,其建设 体系覆盖从硬件基础设施到软件资源分配的全链路精细化管控。 具体包含以下关键维度: 包括服务器选型与配置优化、机型规格标准化(如CPU/内存/存储的规格匹配),以及IDC(数据中20 积分 | 89 页 | 2.06 MB | 1 天前3
2025年超节点发展报告-华为&中国信通院将大带宽的互联 范围,从单台服务器扩展到整机柜以及跨机柜的大规模集群,超节点域内可达百 GB/s 级通信带宽、 纳秒级时延、TB 级超大内存,实现集群能力跃迁。相较“服务器集群”,超节点代表的是弹性、池 化、开放的系统能力:既能以极致吞吐支撑万亿参数训练,也能以低时延满足企业级大规模推理的 刚性需求。 昇腾 AI 坚持架构创新,开源开放,共建产业生态。昇腾 AI 经过 6 年快速发展,已成长为中国 高密度计算体;通过软 硬件协同和智能编排,把训练与推理的双重诉求在同一平台上高效切换;通过液冷、供电与可观测 性 /RAS 体系,把能效与可用度拉回可持续区间。相较“服务器集群”,超节点代表的是弹性、池化、 开放的系统能力:既能以极致吞吐支撑万亿参数训练,也能以低时延满足企业级大规模推理的刚性 需求。 我们相信,计算将再次成为增长曲线的起点。当超节点把“算力、带宽、内存、能效与可靠性” 行业客户在基础模型之上经 SFT + RL 形成“行业 R1”,算力从百卡增至千卡。推理端爆发 要求低时延 + 高吞吐并重:既要扛训练峰值,又要以高效率、低成本、多租户隔离稳定供给,推动 GPU/NPU 虚拟化与弹性调度。 OpenAI 范例:OpenAI 坚定地遵循“规模定律”,通过投入更多算力和更大参数来保证其基础 模型(如 GPT-4/4.5)的持续领先。同时,它基于这些基础模型,通过后训练技术扩展出面向推理20 积分 | 31 页 | 4.79 MB | 1 天前3
未来网络发展大会:2025东数西算算网协同调度业务场景白皮书应用广泛普及的当下,推理服务面临着海量用户访问请求 的挑战。为了提供优质的用户体验,不仅需要具备 GPU 的弹性并发 能力,以满足高并发访问时的计算需求,还要有效降低推理服务成本, 实现经济效益最大化。对于实时性要求较高的请求,在边缘云上使用 GPU 的成本问题尤为突出。 现有公有云通过 Serverless 容器的方式为 AI 推理提供弹性能力, 但由于 AI 镜像和模型文件较大,导致冷启动问题严重,这极大地影 支持调度多供应方的边缘算力来执行推理服务的并发操作,以此 充分整合分散于各个边缘节点的算力资源,极大地提高系统的并发处 理能力,保障在高流量访问场景下服务的稳定性与响应速度。同时具 备基于 GPU 状态指标的弹性扩缩能力,可依据实时负载状况自动调 整算力资源,避免资源浪费或过载,达成资源的动态优化配置。此外, 67 系统还能充分运用多个推理服务,借助智能调度算法有效均衡用户访 问请求,将其合理分配至各个推理服务节点,防止单点负载过高,进 拥堵或 或二次任务调度冲突,从而保障全链路传输资源的循环利用效率。 图 4-64 协同推理-方案执行-公有云托管-资源释放 步骤四:无服务器化的推理服务 弹性资源调整:推理任务实例根据使用情 况弹性扩缩。系统实时监测资源使用情况,当负载增加时自动扩展资 源,当负载降低时释放资源,实现资源的动态优化,降低运营成本。 用户访问 用户通过终端设备产生对推理应用的访问需求。该访问请求首先 20 积分 | 118 页 | 8.35 MB | 1 天前3
2025年数字金融专刊-暨鑫智奖·第六届金融机构数智化转型优秀案例集底层逻辑。如何以数字化转型为核心驱动力,通过体制 机制创新、技术赋能和生态协同,不断做强“五篇大文章”?在人工智能、量子计算等颠覆性技术加速演进 的背景下,如何构建具有迭代适应性的数字基础设施和弹性 IT 架构?如何重构企业级数据战略,加速生成式 AI 与垂直场景的深度融合,建立面向下一代竞争的差异化优势?…… 为促进金融创新的科技驱动与数据赋能,激发数字化转型新动能,探寻金融机构数智化发展的新路径、 在深化创新技术应用方面,东方证券通过“治理 - 算力 - 模型 - 场景”四维联动构建 AI 技术创新体系。在 治理维度,建立合规框架并开展宣贯培训,实现技术防 控与制度约束双轮驱动;算力方面采用混合云架构,建 设弹性算力资源池实现优化配置;模型开发上打造 AI 能力开放生态,实现多维算法模型的快速响应;场景赋 基于证券行业数字化转型的迫切需求,结合前文提 出的六大能力维度框架,证券公司可以重点围绕以下方 数字化基础设施的稳健性与先进性是证券公司数字 化转型成功的基石。一方面,从稳健性角度出发,需要 保障业务连续性与风险抵御能力,比如科学规划数据中 心利用率并储备中长期资源,避免因突发流量或业务扩 张导致的资源瓶颈,以较为弹性的 资源应对不确定性; 另一方面,从先进性角度出发,可以采用云原生架构和 智能安全体系驱动敏捷创新与效率跃升。 在数字基础建设方面,东方证券聚焦数据中心布局 优化,通过建设多地数据中心,实现资源利用率科学调40 积分 | 85 页 | 42.28 MB | 20 天前3
罗戈网:2025年值得关注的供应链技术的主要趋势报告消息的网关将成为互联供应链中的标 准功能。新功能 (例如相关对象和设备之间的协作) 将不断发展。 但是,隐私挑战仍然存在,法规会影响某些用例或智能传感标签。 他们的基础设施可能会带来新的网络安全和弹性挑战,例如,在受 监管的行业中,外人无法接受知道事物的位置。 行动建议 确定环境智能在 2025 年至 2028 年期间提供投资回报 (ROI) 的 信息影子和早期用例,并试点最有前途的示例。将其视为某些当前 用例的潜在替代品。 寻找由实时信息启用的新分析机会(例如,与对象的使用方式、存 储方式和位置以及资产的位置和使用位置有关)。这项技术将加速 “隐形分析” 的趋势。 分析此技术的任何拟议用途对隐私、弹性和数据保护的影响。确保 用户可以在必要时明确禁用它。 环境隐形智能是一种利用新兴的隐形传传感器技术连接企业与环境的新兴技术。【2】指出, 环境智能揭示您组织的盲点。传感器技术越来越便宜,越来越不显眼,从而能够从最隐蔽的 的兴 趣。 最近的危机显然揭示了业务流程的脆弱性。重新设计决策以使其更具弹 性、适应性和灵活性,将需要各种方法和技术的纪律。由 AI 加速平台 提供支持的快速崛起的 DI 平台市场开始为供应链决策者提供弹性解决 方案。 趋势基本影响 DI 可以通过使决策模型对供应链用户明确和透明,从而实现更好、 更及时和优化的决策。它通过对业务环境进行建模来减少决策结果 的不可预测性。 DI 减少了技术债0 积分 | 33 页 | 2.27 MB | 3 月前3
全球数智化指数(GDII)2025:将算力与优质数据转化为智能。 这对国家与企业的启示 :过分侧重某一方面而缺乏 整体协同,只会造成短板和资源浪费。全闪存及智 能存储架构已成为先进算力体系不可或缺的组成部 分,它们保障了数据的无缝流动、系统的弹性扩展 与持续稳定运行。此外,要实现真正的数字化进阶, 还需依托严谨的工程规范,使计算、存储、数据处 理及算法设计能服务于统一的战略愿景。只有在这 些要素间做到均衡发展的国家,才能在人工智能驱 开始数智化转型,但其他同行仍尚未开始,或 者一家输电企业已经完成数智化转型,但发电 站基本上还停留在传统的 IT 系统。传统电网的 一些特性包括集中数据管理、实时信息共享、 在线运维监控以及弹性基础设施。 » 智能电网(IG):在这一阶段,数智化转型已 开始普及(尽管不是以层次化或系统化的方 式),几乎覆盖电力行业的所有环节,从发电 与输电,到配电与用电。电力行业的各个环节 尚未完全整合,但行业已具备执行预测性智能 和管理。 • 实时信息共享:实现调度、维护、 运营等信息的跨部门实时共享, 支撑协同。 • 在线运维监控:实现设备运行状 态在线可视化,增强远程诊断和 预警能力。 • 弹性基础设施:确保电网架构具 有弹性,提高抵御灾害和突发事 件的能力。 • 预测性智能维护:基于人工智能 预测设备风险,实现主动维护和 预防性保护。 • 高效能源调度:通过算法优化配 电,实现源网荷的协同调度。10 积分 | 142 页 | 10.11 MB | 1 天前3
共 29 条
- 1
- 2
- 3
