2025年超节点发展报告-华为&中国信通院支撑大模型创新及云服务场景 加速人工智能科学计算,服务算法创新 助力行业企业智能化升级 系统特征 AI 技术从单点能力突破迈向系统能力创新 超节点技术产业生态发展格局 基础特征:大带宽、低时延、内存统一编址 超大规模 扩展特征:多级缓存池化、资源灵活配比 超高可靠 灵活切分 大模型计算基础设施的挑战 小结 小结 CONTENTS 目录 超节点发展报告 02 当我们站在人工智能大模型技术飞速 超节点架构引领技术革新,重构计算能力边界。超节点架构依托高速互联技术,将大带宽的互联 范围,从单台服务器扩展到整机柜以及跨机柜的大规模集群,超节点域内可达百 GB/s 级通信带宽、 纳秒级时延、TB 级超大内存,实现集群能力跃迁。相较“服务器集群”,超节点代表的是弹性、池 化、开放的系统能力:既能以极致吞吐支撑万亿参数训练,也能以低时延满足企业级大规模推理的 刚性需求。 昇腾 AI 坚持架构创新,开源开放,共建产业生态。昇腾 一体化的设计思维,将计算、存储、网络与运维管理深度融合,锻造出高性能、高效率、高可靠的 单一逻辑实体。它标志着一个全新时代的开启——智算基础设施正从松散组合的算力堆叠阶段,迈 入软硬协同、全局优化的超节点阶段,旨在有效破解超大规模 AI 训练与推理中所面临的扩展性瓶颈、 效率损耗与能耗墙难题,为 AI 的持续创新提供坚实、高效、绿色的算力基座。 为系统分析超节点技术的发展逻辑、技术创新、产业价值以及未来趋势,我院与华为及相关单位20 积分 | 31 页 | 4.79 MB | 1 天前3
AI+制药:AI技术蓬勃发展,AI+制药行业潜力巨大A 编码化合物库、超大 容量特色虚拟化合物库,进一步提高库容化合物对创新及高难度靶点的适用性。在虚拟 化合物库的基础上,公司重点开发了独有的创新化学空间构建 AI 算法平台,搭建了基于 超大成药化学空间的人工智能药物发现技术平台。公司突破传统超大容量虚拟化合物库 的基本概念,利用人工智能机器学习算法,开发了独有的基于分子砌块和有效化学反应 的动态化学空间,从根本上突破了限制超大化合物库构建的算力、存储和管理瓶颈,已 工 智能模型和计算化学手段的迭代筛选,再到 ADMET 性质评估、化合物多样性分析,到最 后人工挑选潜在的活性化合物,进行下一步生物活性测试,每一步都采用了主流的机器 学习和计算化学方法,并结合内部超大(1012~1015 量级)独有且易合成的化合物空间优 势,大大地提高了早期药物筛选的命中率,及发现新颖活性分子的可能性,同时降低早 期药物发现的成本。 图24 药石科技一站式先导化合物计算筛选平台10 积分 | 29 页 | 3.43 MB | 6 月前3
华为-人工智能行业:智能世界2035-20250918-134页生、具身智能的普及以及可 能的超级智能体的出现,到 2035 年,人工智能存储容量需求将比 2025 年增长 500 倍,占比超过 70%。未来应用与存储需求的紧耦合,将推动存储技术向超高带宽,超大容量,超强智能方向演 进,驱动存储范式变革。 未来十年,世界将迎来数千亿智能体的广泛联接。这一趋势将催生面向智能体互联网的新一代 网络架构,推动实现高实时、高智能的交互体验,突破万物互联的边界。 大模型作为构 建在海量数据训练之上的深度神经网络模型, 对网络的能力将提出更高要求,通过发展高质 量的算内、算间和入算网络,可以实现以网强 算,加速 AI 的发展。算内网络通过网络架构创 新实现超大规模算卡互联,以动态流量调度和 100% 自愈释放全额算力;算间网络突破地域 限制,实现数千公里跨智算中心协同保障“0” 丢包传输;入算网络采取分层部署,通过算网 一体服务大幅降低企业推理效率损失,在数据 力,这些能力可能被分布在不同地方,需要通 过网络实现协作。不同智能体的通信需求将呈 现多样化,既有大带宽应用又有海量小包、低 延迟连接,需要探索更加灵活、智能的通信协 议以满足需求。 传送网向超大带宽、超低时延、高可靠高安 全的智能全光网、星地超宽网络演进 综合考虑家庭、个人、企业、AI 训推等场景 人与物的宽带需求,在流量驱动下,未来传送网 络接入层将出现 Tbps 级别的接口,骨干设备支20 积分 | 134 页 | 27.89 MB | 1 天前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求DGX GB200 NVL72 系统构建而成, 这些系统通过 NVIDIA Quantum Inf iniBand 网络连接, 可扩展到数万个 GB200 超级芯片,可以用于处理万亿参数模型,能够保证超大规模生成式 AI 训练和推理工 作负载的持续运行。 l 预计 B200 和 GB200 系列在 2024 年第四季度和 2025 年第一季度之间陆续出货, B300 系列将于 2025 年第二季度至第三季度之间陆续出货。据 工智能技术应用场景,促进智能经济高端高 效发展。 2021 年 5 月 国家发改委、 中央网 信办、工信部中央能 源局 《全国一体化大数据中心协同创新体系算力 枢纽实施方案》 引导超大型、大型数据中心集聚发展,构建数据中心集群,推进大规模数据的“云端”分析处理,重点支持对 海 量规模数据的集中处理,支撑工业互联网、金融证券、灾害预远程医疗、视频通话、人工智能推理等抵近一 线、 芯片的趋势中收益。例如,翱捷科技基于丰富的设计经验及雄厚的技术积 累,曾为全球领先的人工智能平台公司 S 、登临科技、美国 Moffett 等数家知名人工智能技术企业提供先进工艺下的人工智能云端推理超大规 模 芯片定制服务。 请务必阅读正文之后的免责声明及其项下所有内容 牧本定律摆向定制化,关注国产 ASIC 服务 商 图: AI 芯片集群有望达到 100 万张量级 图:博通已为两家头部10 积分 | 38 页 | 1.95 MB | 6 月前3
AI在保险行业的发展和应用(32页 PPT)GPT-1 1.17 亿参数 无监督预训练 + 有监督微调 2019 GPT-2 15 亿参数 半监督语言模 型效果验证 2020 GPT-3 1750 亿参数 超大模型 2022 年初 InstructGPT 13 亿参数 人类反馈强化学习 2022 年 12 月 ChatGPT 基于 GPT-3.5 微调后 用 来改进 GPT 语言 模型的10 积分 | 32 页 | 941.17 KB | 1 天前3
未来网络发展大会:2025光电融合网络技术与产业应用白皮书公里左右。OSFP专为800G/1.6T 设计,尺寸稍大(22.58×100.4×13 mm),提供更高的功率预算和更 好的散热结构,适用于 AI 集群互联等高性能场景,已被谷歌、Meta 等超大规模数据中心采用。 封装技术对比如下: 参数 CFP2 QSFP-DD OSFP 尺寸(mm) 41.5×107.5× 18.35×89.4× 22.58×100.4× 参数 CFP2 QSFP-DD PS-16QAM /800G PM-16QA M 96GBd/130G Bd 可调 调制模式主要为 400G QPSK,适用于长距离、 大容量传输场景,如长 途干线;此外,800G 速率主要用于超大型 数据中心互联以及有 高带宽需求的场景。 当前全球主要光模块厂商在 ZR/ZR+及相干模块领域布局广泛, 封装类型与 DSP 选型呈现多样化趋势,体现出不同厂商在技术能力、 市场定位与演进策 更高性能的硅光平台、更低功耗的 7nm 及以下 DSP 工艺,并有望实 现 C+L 波段覆盖、AI 增强 FEC 等关键技术集成。与此同时,封装形 态也将进一步演进,以支撑 1.6T 在超长距传输和超大带宽集群互联 中的广泛应用。QSFP-DD 和 OSFP 作为面向未来演进的两种主流封 装,在结构设计、功能支持及部署场景方面均展现出各自的优势与局 限。 QSFP-DD(Quad Small20 积分 | 95 页 | 2.94 MB | 1 天前3
浙江省元宇宙产业发展行动计划(2023-2025年)夯实“元设施”基础底座。加快 IPv6、5G+、卫星互联网、 工业互联网、车联网等新一代网络技术开发运用及基础设施建 设,适当超前部署自动感知终端网络。加快建设高效低碳的数 据中心、智算中心等新型存算基础设施,夯实超大规模、实时 算力的算力支撑。推进云网协同和算网融合发展,支持发展 GPU 实时渲染等高性能计算,鼓励算力、算法、数据、应用资 源集约化和服务化创新。提升区块链基础设施能力建设,强化 安全隐私0 积分 | 12 页 | 330.43 KB | 5 月前3
未来网络发展大会:2025分布式算力感知与调度技术白皮书安全事件响应速度,通过精细化管理降低城市能源消耗,是提升城市 治理现代化水平的关键技术,更是打造安全、高效、绿色、宜居未来 47 城市不可或缺的数字底座。 4.3 大模型分布式训推 由于机器学习与人工智能的迅猛发展,超大规模语言模型已跃升 为科技竞逐的新高地。然而,要训练和上线诸如 GPT-4 之类的模型, 必须依托巨大算力与高速网络协同配合,这对计算与通信基础设施都 提出了极为严苛的要求。训练过程中需吞吐 TB-级乃至 大幅提升;在推 理环节,模型副本可根据请求分布和节点健康状况灵活下沉与回收, 为全球用户提供低时延一致性响应。预测驱动的弹性扩缩容与秒级故 障切换机制进一步增强了系统的鲁棒性和资源利用率,使得超大规模 语言模型的迭代周期缩短、运行成本降低,并在面对突发负载或硬件 故障时依然能够保持平滑、稳定的服务表现。因此,分布式算力感知 与调度能够成为支撑下一代生成式 AI 平台快速演进和大规模部署的 源实现跨域全局化聚 合,形成覆盖多数据中心与云平台的协同体系。企业通过构建统一资 源池,推动离散算力向可度量、可流通的服务形态转化,智能调度系 统依托自适应算法实现精准动态供给。行业实践表明,超大规模云服 务商已建立体系化调度框架,显著提升资源集约效能;混合云架构通 过能力下沉构建全域协同的算力供给网络。开放标准体系持续深化 ——硬件层依托开放计算推进异构环境兼容,软件层基于云原生规范20 积分 | 73 页 | 2.15 MB | 1 天前3
人形机器人行业:由“外”到“内”,智能革命-2024年5月13日发布了人形机器人Unitree G1,定价9.9万元起。G1高127cm,重35kg, 头部搭载激光雷达及深度相机,续航可达到2 小时,移动速度为2m/s;拥有23-43个关节电 机,具有超大关节运动角度空间;AI加持, 由机器人统一大模型UnifoLM驱动,拥有自我 学习和迭代升级的能力;力控灵巧手结合力 位混合控制,灵敏可靠,可以模拟人手实现 对物体的精准操作。 02 04 全尺寸通用人形机器人。2024年5月13日,宇树科技发布 了人形机器人G1,高127cm,重35kg,头部搭载激光雷达及深度相机,续航可达2小时,移动速度为2m/s;拥有23-43个关节电机,具备 超大关节运动角度空间;由机器人统一大模型UnifoLM驱动,拥有自我学习和迭代升级的能力;力控灵巧手结合力位混合控制,灵敏可 靠,可以模拟人手实现对物体的精准操作,能做饭煎蛋、徒手砸核桃,且行走、跑步的0 积分 | 49 页 | 3.78 MB | 5 月前3
DeepSeek大模型及其企业应用实践2025年1月20日,DeepSeek-R1正式发布,拥有卓越的性能,在数学、代码 和推理任务上可与OpenAI o1媲美。 DeepSeek创始人 梁文峰 2.2 国内的大模型产品 n 通义千问 通义千问是阿里云推出的一个超大规模的语言模型,它具备多轮对话、文 案创作、逻辑推理、多模态理解、多语言支持的能力。通义千问这个名字 有“通义”和“千问”两层含义,“通义”表示这个模型能够理解各种语 言的含义,“千问”则表示 企业级大模型落地解决方案服务 来自UST 6.1 企业级大模型落地解决方案服务 来自UST 6.1 企业级大模型落地解决方案服务 6.2 DeepSeek大模型一体机 提供1.5B轻量版至671B超大规模模型的灵活 调用,满足边缘端轻量化推理与云端复杂训 练的双重需求,支持模型蒸馏与定制化开发, 助力企业“按需取用” 全尺寸模型支持 通过智能算力管理引擎,实现CPU、GPU等 异构资源的动态分配,提升资源利用率,降10 积分 | 147 页 | 16.82 MB | 6 月前3
共 24 条
- 1
- 2
- 3
