湖南大学:2025年智算中心光电协同交换网络全栈技术白皮书模型规模 典型硬件 GPU 数量 训练成本(美元) 1 亿~10 亿 V100/A100(数十卡) <100 <10k 百亿级 A100/H100(数千卡) 1,000-5,000 1M-10M 千亿级 H100(万卡级) 5,000-10,000 10M-100M 万亿级+ H100/B100(数万卡) >20,000 100M-500M+ 大模型参数量达到万亿,迭代训练需使用数据并行、流水线并行、 了极高的要求。 下表展示了不同模型规模单次梯度同步数据量的大小。 模型规模 典型 GPU 数 量 单次梯度同步数 据量 通信敏感度 十亿参数 数十卡 10GB 至 50GB 中等 千亿参数 数百至千卡 300GB 至 800GB 高 万亿参数 数千至万卡 大于 1TB 极高 电交换机的交换性能依赖其内部交换芯片,交换芯片的性能由其 交换容量(switch capacity)衡量。交换芯片的交换容量 了整体性能的提升。 网络延迟瓶颈 大模型训练需要多机多卡完成该轮所有集合通信操作后才可进行 下一轮迭代,这种同步性特征要求智算网络必须提供极低的长尾时延, 避免出现木桶效应[8]。根据理论推算,对于千亿参数规模的大模型训 练来说,动态时延由 10us 增加至 1000us,GPU 有效计算时间占比将 降低 10%左右。同样,大模型推理对网络时延也有着更高的要求,以 确保能够为用户提供优质的推理服务。20 积分 | 53 页 | 1.71 MB | 1 天前3
《增长五线:数字化时代的企业增长地图》企业增长地图系统化搭建与优化路径- 读书笔记设计增长地图 企业从现有 资源和能力出发所能找到业务 增 实现企业指数级的增长 增长路径中可以让业务在短期内呈现指数级 历经 12 年、 60 多家企业、千亿量级验证的增长新思维。 天 际 线 长点的总和,摆脱碎片化的增长思路。 企业估值或者企业价值的上限 爆发增长 撤 退 线 增 长 线 成长底线 本书价值 增长的线。 、谷歌、亚马逊、脸书这类公司。这类公 司 自诞生起,就具有互联网形态,就有数据累积,未来可 以依 据大数据积累往人工智能进化 数字化是爆发线的必要基因,近 30 年来,过千亿 市值的创业公司,无一例外全部都拥有数字化基 因。 表 1916—2004 年成立的市值千亿美元企业 爆发线设计策略: 数字化是爆发线的必要基因 企业完全没有数字化或者仅限于职能部门的信息化。 原生型数字化公司 再生型数字化公司 传统公司10 积分 | 103 页 | 6.56 MB | 5 月前3
全球计算联盟GCC:2025年异构算力协同白皮书化。FlagScale 已支持包括智源自研 Aquila 系列与 Emu3 在内的 10 余种大模型的端到端训练,涵盖语言、多模态、具身智能等 多个领域,支持稠密与稀疏模型训练,参数规模从亿级至千亿级不等。 (2)在集合通信层:FlagScale 已兼容包括壁仞、天数智芯、沐曦、昆仑芯、寒武纪、 摩尔线程、海光以及华为昇腾等在内的多种国产 AI 芯片,同时支持 CPU 中转和 RDMA 直连 策略)等技术,在流水调度层面取长 补短、深度调优,设计异构并行自动寻优机制实现多种拆分策略的最佳组合。 基于上述方案,壁仞科技联合上海人工智能实验室开展四种国产 GPU 千卡规模混合训 练,混训效率达 98.5%,实现千亿参数大模型长时间高效稳定训练,实现了国产芯片+国产 异构通信库+国产训练框架+国产大模型的深度融合。下一步将参照工信部“算力互联互通 行动计划”算力业务互通创新行动要求,进一步攻关万卡规模异构混训难题,逐步实现万亿、10 积分 | 31 页 | 1.21 MB | 1 天前3
面向新型智算中心的以太网弹性通道(FlexLane)技术白皮书(2025年)背景与需求 近年来,人工智能(AI)技术取得了突破性进展,特别是以 ChatGPT、Deepseek 为代表的大语言模型(LLM)的兴起,标志着 AI 进入了一个全新的发展阶段。大 模型通常拥有数千亿甚至万亿的参数,中小模型通常也有十亿参数以上,需要海 量的算力进行训练和推理。为满足庞大的算力需求,智算中心作为 AI 发展的新 型基础设施底座,正加速在全球范围内建设和部署。 图 1-1 传统数据中心与新型智算中心流量模型对比0 积分 | 24 页 | 2.92 MB | 5 月前3
2025年提升区域电力互济能力 促进新能源高比例发展报告item_ id=8593536397673564232&track_id=f767296e-8aad-4adc-a960-c0bf2ceee5e. [9] 千龙网 . 西北电网新能源年外送电量首超千亿千瓦时 [EB/OL](2025-01-03)[2025-07-17]. https://baijiahao.baidu.com/s?id=1820206285227720618&wfr=spider&for=pc20 积分 | 28 页 | 1.16 MB | 13 天前3
鸿蒙2030白皮书 共筑万物智联的鸿蒙世界-华为端侧大模型和云侧大模型协同工作,能够发挥 LLM 大模型的最大潜力,并且从成本、能耗、时延、 隐私安全、个性化等多方面为用户提供极致体验。 云端的超级大脑可以解决复杂问题,提升回答的质量,一般以参数量在千亿级别的大模型 部署,推理的算力成本较高。端侧的灵活小脑可以实现低延时低成本高隐私安全的反馈,并且 基于用户数据可以提供个性化服务。部署的模型参数量一般十亿到百亿。端云协同可以最大化 发挥“端侧0 积分 | 41 页 | 3.36 MB | 5 月前3
2025年广域物联——中国蜂窝&卫星物联产业研究白皮书行速率提升到万兆,上行速率提升到千兆,物联规模从百亿提升至千亿连接。据悉,载波聚合技术作为一种通过合并多个 载波频段来增加网络带宽的先进技术,在 5G-A 中得到了进一步的发展和应用。 中国 IMT-2020(5G)推进组官方给出了 5G-A 六大应用场景,分别是沉浸实时、智能上行、天地一体、工业互联、 千亿物联、通感一体。其中最具有代表性的物联网应用场景即“千亿物联”,涉及技术既包含目前运营商最大规模开通并积10 积分 | 85 页 | 41.17 MB | 5 月前3
医疗健康大模型伦理与安全白皮书(93页 WORD)后通过少量有标签数据的微调来适应特定任务。这种方法极大地降低了对大量人工标注数据的依 赖,同时也加速了模型的迭代更新过程。 随着时间的推移,模型的规模得到了快速的膨胀,参数量从最初的数亿增长至如今的数千亿,从而 人工智能的发展迈入了大语言模型时代。这些大语言模型不仅可以用于经典的 NLP 任务,还在多 轮对话、文案生成、编程辅助、多模态交互等新兴应用场景中展现出巨大的潜力。越来越多的领域 如医疗、媒 大模型应用技术分析 2.4.2.夸克健康助手 夸克 健康 助手来 源 于 阿里巴巴 智能 信息 事 业 群 旗 下的 夸克 App , 是基 于 全 栈 自 研 、 千亿级参 数 的夸克大模型推出的健康大模型应用。目前, 夸克已与 200 多位权威医学专家、 60 多家全国知名 公立三甲医院和 40 多家医 学机构合作, 累计服务 千万级医疗健康用户,20 积分 | 93 页 | 12.19 MB | 13 天前3
上海科学智能研究院:2025年科学智能白皮书1. 从大语言模型走向自主智 能体 1.1 背景 近年来,以大语言模型(LLM)1-3 为代 表的人工智能 (AI) 技术快速发展,已在多个 领域展现出先前技术所不具备的涌现能力。 借助千亿级参数规模,大语言模型不仅实现 了海量知识整合和逻辑推理能力的突破,还 展现出向通用人工智能演进的巨大潜力,具 有重要的研究和应用价值。学术界与工业界 纷纷将目光聚焦于大语言模型的相关研究, 多功能家务机器人展现出强大的实用能力, 推动机器人在日常生活中的应用。 此外,具身智能在医疗、神经科学和 虚拟现实等领域实现重要突破。复旦大学 加福民团队开发脑脊接口技术,让瘫痪者 重获行走能力;复旦大学类脑院构建千亿 级神经元数字孪生平台 8,推动神经调控 应用发展;VR 技术与具身智能结合,增 强沉浸体验,推动未来人机交互革新。具 身智能正迈向产业化,赋能医疗、制造、 家用机器人及虚拟现实等多个领域。20 积分 | 29 页 | 2.74 MB | 5 月前3
《一本书读懂数字化转型》数字化转型规划和落地说明书读书笔记数字技术和基础设施(大数据) 多样的数据类型 价值密度低 海量的数据规模 快速的数据流转 大数据的四大特征 容量更大 超大网络容量,连接数密度大幅度提高,具 有千亿台设备的连接能力,可满足物联网通 信。 系统的协同化、智能化水平提升 表现为多用户、多点、多天线、多摄取的协同组网, 以及网络间灵活的自动调整。 传输更快10 积分 | 118 页 | 8.59 MB | 5 月前3
共 17 条
- 1
- 2
