中国移动:云智算技术白皮书(2025)DPU,以云智算场景需求为牵引,与国产芯片厂商深 度合作,提带宽、降延迟、优传输,构建端网协同的高性能互联方案。带宽方面, 研发智算 RDMA 技术,大幅提升网络带宽,满足训练场景大带宽要求;延迟方面, 搭载轻量化 RTT based 拥塞流控算法,有效降低网络时延,满足推理场景下低时 延要求;传输方面,通过端侧多路径、数据高速采集技术,优化 RDMA 传输机制, 从源头上解决多路径 hash 冲突问题,提升智算集群带宽利用率与可靠性。 中的算子特征与硬件资源约束,智能分配计算与通信任务,提升万卡级训练算力 利用率(MFU)。 面向近期,实现并行策略自动搜索系统。通过解析大模型网络结构并建立算 子级统计指标库,结合专家经验与多目标优化算法,量化评估集群的显存占用与 通信效率,输出兼顾资源利用率与训练速度的并行配置方案,最终在超万卡集群 中实现模型训练 MFU 超 50%。 面向中远期,研发算子级自动并行框架,动态分析计算图中的算子特征与硬 训 练的 MFU 突破 60%。 2.5.2.2 低精度训练 低精度训练可以显著加速大模型训练性能,但梯度溢出问题严重制约模型收 敛稳定性。针对上述问题,通过算子级优化(重构计算流,结合动态量化技术, 即 FP8/INT8 精度自适应切换)与梯度缩放机制,在确保训练精度的前提下,压 缩计算量,实现算力效率与训练精度的双重突破。 面向近期,完善 FP8 混合精度训练框架,构建梯度异常检测与自动修复机制;0 积分 | 30 页 | 716.31 KB | 8 月前3
艾瑞咨询-2024年中国基础云服务行业发展洞察报告展历程看,智算中心是数据中心在服务能力上从“综合化”向“专业化”的转型。在应用领域上,传统数据中心以服务各类企业业 务应用场景为主,智算中心则专注于人工智能领域,服务大模型训练、推理及其他人工智能相关场景,如图像渲染、金融量化、医 药开发、自动驾驶、智能制造等。 来源:公开资料、专家访谈、艾瑞咨询研究院自主研究及绘制。 数据中心 (IDC) 超算中心 (HPC) 智算中心 (AIDC) 整合通用算力资源,为各类企 业业务提供综合的算力支持 搭载CPU芯片的通用计算服 务器 服务特定场景的超算服务器为主 搭载GPU芯片为主的AI服务器 核心 设施 企业综合业务场景 气象预测、基因测序、工业仿真、芯片 设计 …… 模型训练、模型推理、图像渲染、 金融量化、医药开发、自动驾驶…… 应用 领域 基础云厂商 智能算力中心主要建设者 运营商 ICT厂商 AI厂商 …… 智能算力中心概念及主要建设者 15 ©2024.9 iResearch Inc iresearch.com.cn 58.8% 14.2% 6.3% 7.2% 4.0% 1.6 % 0… 0… 6.3% 2023年中国智能算力需求占比 大模型 算法推荐 自动驾驶 科研 量化交易 虚拟人 生物制药 制造 其他 中国智能算力需求结构 大模型占据中国智能算力需求主导地位 - 通用大模型占据主导:由于大模型本身对高端算力具有强需求,在总体的智能算力需求中,大模型的需求占比最高,将近六成。10 积分 | 29 页 | 1.88 MB | 9 月前3
备份 思博伦2025年度5G报告:看5G商用进程过半 2025能力做好了准备。 中场阶段意味着前面还有很长的路要走。尽管做好了充分的准备与证明工作,我们的行业仍然面临着 复杂性、激烈竞争与经济的不确定性。 无论是固定无线接入(FWA)、专用网络还是5G轻量化(RedCap)及5G V2X等新兴技术,各大企业 都将为其带来真正的价值。随着网络API、人工智能赋能的基础设施、低空经济及非地面网络等技术的 进步,5G商用的下半场将会充满惊喜与刺激。 需 有 的身份管理系统,对用户或设备进行身份验证。此外,对于通用 API框架(CAPIF)的测试需求不断增加,这一测试可以安全地 向第三方开发人员开放网络功能。 5G核心网已准备好应对数百万台轻量化(RedCap)设备, 并确保它们能与传统的智能手机网络共存。 • 6 思博伦5G报告 2025 进展、关键点与未来展望 对大规模漫游场景进行验证,如5G漫游的home-routed及 内类似的智造项目 铺平了道路。 2024年5G经典案例 5G LAN助力开创“智造”转型 12 思博伦5G报告 2025 进展、关键点与未来展望 在5G Release 17中引入的轻量化(RedCap)技术提供了一种“轻量级” 的5G体验,从而实现物联网设备连接的简化。它能够将5G NR模组的成本 降低80%以上,同时还可以将功耗降低30%以上。在对RedCap进行试验或 实10 积分 | 25 页 | 10.53 MB | 9 月前3
ICDT融合的6G网络白皮书5.0(2025)理是:终端在估计到空频域的信道矩阵后,将原始信道或原始信道经过预处理后得到的输入 CSI,然后利用自编码器中的编码器(即下图中的 AI/ML generation part)生成压缩码字,然 后将其量化为二进制比特后反馈给基站;基站接收到压缩码字后,首先进行解量化,然后利 用自编码器中的译码器(即下图中的 AI/ML reconstruction part)重建出输入的 CSI。 16 / 87 图 2-1-1 基于 AI 图如下图所示:在 UE 侧,t 时刻,将 t 时刻对应的原始信道或经过预处理的信道,以及历 史时刻的相关信道信息,输入 AI/ML 生成部分进行压缩,并将压缩后的浮点数量化为二进 制比特后反馈给基站;在网络侧,将 UE 侧反馈的二进制比特进行解量化,基于历史时刻的 CSI 和 t 时刻的 CSI 反馈信息,利用 AI/ML 重建部分恢复出 t 时刻的信道信息。 图 2-1-4 基于 AI 的时空频域 CSI 个站点测量的延时偏差叠加延时扩展后,是否 落在 0, CP 的范围,用一个比特来指示。 多个站点的频率偏差反馈 用户上报的频率偏差,是指第 n 个站点与参考站点之间的相对偏差,它在 0, AFO 之间 均匀量化。每个频率偏差反馈表示FOi = i × AFO MFO−1,i = 0, 1, ⋯, MFO − 2,AFO是最大频率偏 差,例如AFO可取 0.1ppm,或其它的值,MFO ∈ 16, 3210 积分 | 88 页 | 5.88 MB | 8 月前3
中兴通讯自智网络白皮书2025eckpoint的读写性能进行优化,以 快速完成断点续训。通过全生命周期的自动化和智能化运维,提高资源利用率,降低运维成本。 除了训练,推理也是自智网络需要关注的关键能力之一。通过知识蒸馏、模型量化和推理引擎优化等新技术突破,可以 不断降低推理成本。根据不同应用场景的需求,可以选择不同尺寸的模型,以平衡推理硬件、速度和效果。这些措施有 助于实现低成本推理,满足自智网络的发展需求。 10 网络工具语义建模 监 控 LLM 分析->规划 执 行 沉淀 调用 建模 调用 调用 LPI 智能体(外部系统) 智能体(外部系统) LPI LPI 智能体行为控制:智能体正在进入批量化生产时代,智能体有三个核心特质:第一,可根据目标独立采取行动,即自主 决策;第二,可与外部世界互动,自如地使用不同的软件工具;第三,可无限期地运行,具备可进化性,能够在工作进程 中通过反馈逐步自我优化,比如学习新技能和优化技能组合。 CNIA RNIA ZENIC CIIA 网络变更 性能优化 故障监控 能效优化 训推一体,在线精调,单域智能管控 Copilot 助手 Agent专家 网元 AI内生,实时感知知,轻量化推理执行 跨 域 端 到 端 闭 环 单 域 自 动 化 闭 环 传输 ... 无线 IP 核心网 网络云 接入 智算板/智能光模块... 网络变现 精准营销创收 开通及时率 精准营销成功率10 积分 | 41 页 | 7.03 MB | 9 月前3
2025年AI CITY发展研究报告——“人工智能+”时代的智慧城市发展范式创新模型训练:内置全栈模型训练工具,支持大模型预训练、微调(全量SFT、LoRA)、强化学习(DPO),支持导 入第三方大模型预训练、微调(全量SFT、LoRA)。 模型压缩:支持NLP大模型的量化压缩,降低推理资源占用,提升推理性能,支持导入压缩工具对第三方大模型 进行压缩。 模型部署:支持中心和边缘部署,实现AI模型的云边协同管理。 数据平台 数据获取 自定导入 多模态导入 明文导入 模型评测:支持对平台部署的大模型进行评测,支持API接入外部第三方模型进行评测,支持选择数据集进行模 型评测和可视化结果展示,部署前充分掌握模型实际效果。 AI模型平台 模型训练 模型压缩 模型部署 模型评测 压缩策略 模型量化 压缩任务管理 人工 评测 自动 评测 NLP、CV、 气象、多模态 评测任务管理 云/边缘部署 能力 调测 多实例 滚动 升级 同步、 异步部署 部署任务/模型服务管理 分析的基础数 据资源。 知识库: 知识是从数据中提炼出的有价值的信息,是对数据的深度理解与抽象概括,知识的形成是数据价值升维的过 程。首先,对基础数据资源进行结构化处理,通过统计分析、文本向量化、图像特征提取等技术构建输入特征空间。 其次,选择监督学习、无监督学习、深度学习算法等适配算法,利用梯度下降等优化方法拟合数据分布,通过交叉验 证和正则化避免过拟合,实现模型训练迭代。最后,将模20 积分 | 78 页 | 5.45 MB | 7 月前3
安全牛:工业互联网安全能力构建技术指南(2025版)域,工业控制系统的安全运行关乎能源供应 安全;采矿业的自动化开采与远程监控系统也对安全防护提出了极高要求。同时,兼顾中小企业在工业互 联网安全建设中的需求,针对其资源有限、技术薄弱等特点,探索轻量化、易部署的安全解决方案,助力 中小企业在数字化转型中筑牢安全防线。 (二)技术研究范畴 基于工业互联网安全“设备、控制、网络、平台、数据”的立体防护体系与精准定义,本报告在技术 层面重点研究 5G、大数据、AI、数字孪生等新兴高科技技术的应用,主要应用 场景包括生产优化、工艺优化、设备管理、智能工厂管理、设备故障预测、安全防护等诸多方面,并且普 遍取得了生产效率提升、成本降低、产品质量提高等显著成效。其中,在有明确量化成效的样本中,其生 产效率平均提升约 35%(范围值:3% - 50%),运维成本平均降低约 28%(范围值:13% - 41%)。此 外,通过工业网闸、工业防火墙等技术和设备,大多数企业已经建设完成了工业互联网的安全体系建设和 系统相关的关键工业主机、网络设备、控制设备等)。 (七)《工业领域数据安全能力提升实施方案(2024-2026)》(2024 年 2 月印发) 51 第三章 工业互联网安全能力构建 作为最新实施计划,其价值在于推动数据安全能力量化提升,提出到 2026 年底工业领域数据安全保 障体系基本建立的总体目标。包括超 4.5 万家企业开展数据分类分级、研制不少于 100 项数据安全标准、 遴选覆盖行业不少于 10 个、总数量不少于20 积分 | 114 页 | 8.60 MB | 7 月前3
量子信息技术应用案例集(2024年)数据集包含若干张手写数字“6”和“9”的黑白图片,将其降采样 为 3*3 像素图像后,选取 6 张图片组成训练集,测试集则包含 1967 量子信息技术应用案例集(2024) 43 张图片。神经网络选用单隐层量化神经网络,输入层包含 9 个节点, 隐层包含 1 个节点,输出层包含 1 个节点,每个像素点对应了神经 网络的一维输入,神经网络输出正值表示预测给定图片为数字“6”, 否则表示预测为数字“9”。验证方案如图 图 31 相位漂移量检测、反馈与补偿方法 面向配网调控业务的轻量化量子密钥无线分发技术。提出了面 向电网末端海量业务终端无线安全接入的量子密钥自适应更新方法, 研制了量子密钥服务平台,解决了无线通信量子密钥低成本分发难 题,如图 32 所示。提出了适用于配电自动化、分布式新能源等各类 终端的量子密钥轻量化 IBC 双向身份认证方法,有效降低身份认证 复杂度及模块研发成本。研制了首个低功耗 量子卫星完成星地对轨 3 次,平均成码率 98kbits。验证了基于“墨子 号”量子卫星中继实现面向电力广域业务的量子保密通信的可行性。 国网浙江省电力有限公司绍兴供电公司开展面向配网调控业务 的轻量化量子密钥无线分发应用验证。通过搭建量子密钥服务平台, 采用低功耗 FTU 量子加密板卡完成绍兴全市配网终端 FTU、DTU 量子化改造 1423 套,提升配电终端在无线公网环境下“三遥”实现率,0 积分 | 102 页 | 3.92 MB | 8 月前3
能耗监测平台解决方案线费用(可选)。 三、解决方案 - 效益分析(针对政府部门) 所得效果: 对于政府节能减排职能部门而言,通过技术手段代 替了过去低效的人工信息收集,使得对企业客户的生产 状态能更加客观量化,大大提升对行业整体节能减排管 理水平。 所付成本: 平台服务费用:每个管理员账号 100 元 / 月 平台专线费用:每条 800 元 /2M/ 月 三、解决方案 -0 积分 | 21 页 | 4.31 MB | 9 月前3
Manus在AI Agent领域实现技术突破,AI驱动智算中心升级-中原证券2024Q3,我国 AI 手机出货量同比增长 591%,体现出我国庞大的市场空间以及本土厂商 在推动 AI 手机功能创新方面的早期投资和努力。2024 年,我国厂商在 AI 模型优化方面取得显 著进展,通过最新量化和剪枝技术在保证输出质量的同时精简参数规模。例如,小米的 MiLM2 将模型参数从 60 亿剪枝至 40 亿,荣耀和 vivo 分别将其模型参数从先前的 70 亿剪枝至 30 亿。 小参数模型的 有利于端侧部署底层模型统一化,通过提升兼容 性推动端侧 AI 生态建设。DeepSeek 以其轻量化优势,更好的适配终端设备,降低了模型的存 储和计算需求,为终端设备的底层模型统一化提供更多可能。DeepSeek 通过模型优化、软硬 协同、跨平台适配等技术手段,显著提升终端设备端侧部署的兼容性,加上其轻量化版本能够 适配从低端到高端芯片的多种硬件,进一步推动端侧 AI 的生态建设。 DeepSeek0 积分 | 28 页 | 2.98 MB | 8 月前3
共 36 条
- 1
- 2
- 3
- 4
