中科海光:2025年深算智能:海光DCU行业实战手册
13.99 MB
25 页
0 下载
20 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pdf | 3 |
| 概览 | ||
海光DCU行业实战手册 深算智能 海光信息技术股份有限公司成立于2014年,于2022年在科创板上市(股票代码:688041),主要 从事高端处理器、加速器等计算芯片产品和技术的研究、开发,目标是成为世界一流的芯片企 业,为数字中国提供核心计算引擎。海光信息以务实的态度、创新的理念、先进的技术和可靠 的产品,致力于促进我国信息产业核心竞争力的提升。 作为国产先进微处理器产业的推动者,海光已独立实现多代通用处理器CPU产品和人工智能加 速器DCU产品的自主研发和商业化应用。基于卓越性能、主流生态、安全可靠、自主迭代等优 势,海光芯片已搭载于多家国内知名整机厂商的产品,并在云计算、大数据处理、人工智能等商 业场景中得到广泛应用,覆盖政府、通信、金融、医疗、教育、交通、能源等关键行业,占据 国内高端计算、智能计算市场头部份额。 海光信息技术股份有限公司 HYGON 01 02 HYGON 海光DCU行业实战手册 公司介绍 / COMPANY PROFILE 使命 MISSION 为数字中国 提供核心计算引擎 愿景 VISION 成为世界 一流的芯片企业 HYGON 03 04 HYGON 海光DCU行业实战手册 先进微处理器技术国家工程研究中心是专门面向C86架构芯片核心关键技术研究与工程设计的国家级工程实验室。 实验室三大优势 架构 设计 安全 设计 前端 设计 后端 设计 定制IP 设计 封装 设计 领先的“芯”研发体系 北京 芯片前后端设计 苏州 芯片封装测试 成都 芯片验证系统测试 上海 内存控制器设计 芯片安全设计 研发与创新实力 一流研发支撑体系 / FIRST-CLASS R&D SUPPORT SYSTEM 全面设计能力 / COMPREHENSIVE DESIGN CAPABILITY 拥有完整芯片研发部 门的工程实验室 01 强强协作,拥有可使 用、可修改的处理器 技术资源 02 拥有国内芯片领域实 践经验最丰富的权威 专家团队 03 知识产权 千万行 源代码 200+ 集成电路 专有权 150+ 软著 900+ 发明专利 研发团队 80%+硕士/博士 学历结构 92%研发人员 人员构成 20年核心人员从业经验 经验资历 研发环境 硬件仿真实验室 100亿门仿真器 服务器投入运行 5000+台 物理CPU核 近15万 为HYGON服务器 80% 产品介绍 PRODUCT INTRODUCTION 目录 CONTENTS DTK DAS DAP 09 10 11 PRODUCT INTRODUCTION 产品介绍 01 SOLUTIONS & CASES 海光DCU应用场景 02 实战场景一:AI大模型一体机 实战场景二:行业智能化 实战场景三:科学计算 实战场景四:工程计算 13 17 35 39 ECOLOGICAL ACHIEVEMENTS 生态成果 03 光合开发者社区 智能计算联合实验室 光合组织介绍 海光DCU生态图谱 44 45 46 47 HYGON 05 06 HYGON 海光DCU行业实战手册 HYGON 07 08 HYGON 海光DCU行业实战手册 DCU:国内唯一全精度通用AI加速卡 DCU人工智能软件栈 / AI SOFTWARE STACK 通用架构 采用GPGPU大规模并行计算架构设计,通用性好,全面兼 容CUDA、ROCm软件生态,迁移成本低 开源生态 支持主流AI框架和工具链,覆盖全部开源大模型,支持主 流AI、AI for Science和科学计算等各类应用软件 全面精度 支FP64、FP32、TF32、BF16、FP16、INT8等多精度 计算,精度完备,全面支持科学计算和AI加速计算 全面兼容 面向主流AI生态 DCU迁移平滑无忧 全程护航 支持大模型 多元场景应用落地 DAP(DCU AI Platform / DCU人工智能应用平台) 云原生AI平台 大模型应用平台 光源ModelZoo | 镜像仓库 开发者社区 基础算子层优化 框架工具层优化 模型扩展组件层优化 DAS(DCU AI Software Stack/DCU人工智能基础软件系统) C86 CPU DCU加速卡 存储 高速网络 DTK(DCU Tool Kit/DCU异构计算平台) 全栈优化 软硬协同释放DCU 澎湃算力性能 DCU:全面兼容主流生态 / FULL ECOSYSTEM PROFILE 类CUDA API的 开源软件开发平台 原生支持多种加速库 及各类深度学习框架 提供完整的开发、 迁移、编译、调试工具 支持容器化工具 大规模部署 支持Kubernetes 和Slurm调度系统 功能健全的DCU软件栈 性能分析工具 主流HPC应用 Gromacs/VASP etc 人工智能框架 TensorFlow/PyTorch/ paddlepaddle 国内典型 异构应用 OpenMP/OpenACC 类CUDA编程环境 OpenCl 编译器 驱动 DCU加速卡 主流应用 函数库 开发环境 通讯加速库 SPARSE加速库 LAPACK加速库 PRIM FFT加速库 BLAS加速库 Thrust DNN加速库 全面兼容的开发环境 基础线性代数库 CUBLAS DCU BLAS 傅里叶变换库 CUFFT DCU FFT 神经网络加速库 CUDNN DCU DNN 数值线性代数求解库 CUSOLVER DCU SOLVER 稀疏基础线性代数库 CUSPARSE DCU SPARSE 支持C/C++/Fortran、OpenMP/OpenACC、Python编程,支持GPU Direct网络加速,支持多种 Profiling 方法 HYGON 09 10 HYGON 海光DCU行业实战手册 DTK异构计算平台 DTK(DCU Toolkit)集成了DCC(DCU Collect Compiler)编译器、经过验证和优化的计算库,支持多种编程语言,同时提供运行、 编译、调试和性能分析功能。 DTK可支持主流科研工具,包括但不限于Gromacs、Lammps、PWmat、Openfoam、DeePMD-kit、DeepFlame、Quda、SD3、 Alphafold、Geoeast,覆盖人工智能、材料科学、生命科学、工业仿真、气象环境、地质地震等科研领域。 DTK兼容国际主流的GPGPU开源生态,可直接编译开源的GPGPUC/C++代码,旨在让用户快速移植和使用开源社区的计算工具,降低 适配周期和人力投入,致力于让用户只维护一套代码。 场景全面 覆盖AI、Al4S、Science 领域加速需求 拥抱开源 兼容主流GPU开源生态, 享受开源红利 全面适配 已适配260+Science应用 工具,覆盖12大科研领域 全栈自研 针对海光DCU设计,全栈 自主研发,并持续优化 全面覆盖 实现Al全场景覆盖 框架组件全面适配 高效性能 性能卓越 达到行业主流水平 快速迭代 小步快跑发版节奏 满足快速变化需求 开源开放 打造开源开放社区 加速DCU生态建设 DAS(DCU AI Software Stack)提供AI算子优化库、AI模版库、AI编译器、基础AI框架、推理框架和三方套件,并通过OpenDAS 以开源方式提供AI扩展套件服务。 DAS与 ModelZoo、镜像仓库、创空间、开发者社区、AI 平台等构成一套完整的人工智能基础设施,全栈全场景赋能用户AI应用研 发,助力千行百业智能化转型,加速新质生产力建设。 DAS人工智能基础软件系统 基础数学库 适配两代产品/全兼容/性能优异 DCC编译器 适配gfx928/gfx936 /支持内嵌PTX /持续优化 运行时系统 API覆盖率100%/通讯库优化/问题自排查 支撑上层科学计算/AI框架与应用 GPUFusion兼容CUDA/ROCm双生态 异构加速卡驱动 国产CPU 国产GPU加速卡 多操作系统支持,更广泛国产操作系统支持 CentOS、Ubuntu、NFS、Kylin、UOS 基础数学库 HIP数学库 DCC编译器 HIPCC 通讯库/运行时库 工具链可视化 调试器和调优器 Cmake 构建系统支持 librccl.so、 libhiprtc.so、 librocm_smi64.so等 运行时系统 HIP头文件 HIP Runtime API CUDA兼容数学库 NVCC兼容编译器 CUDA头文件 CUDA Runtime API libnccl.so、libnvrtc.so、 libcudart.so、 libnvidia-ml.so等 CUDA核心组件功能覆盖率除硬件外达到100% 核心组件 runtime driver API cublas cufft cusparse curand nvrtc nccl 347 485 326 52 491 27 13 19 81.7% 66.73% 74.5% 67.3% 96.12% 83.53% 100% 100% 100% 100% 100% 100% 100% 100% 100% CUDA 可用接口数 初始函数功能覆盖率 (2024.1基线) 当前函数功能 覆盖率 96.95%(15个半精接口 CUDA已标记为废弃 扩展组件层 支持并行解码/高版本组件/性能优化 框架工具层 全系列产品兼容/支持主流AI生态框架 基础算子层 支持深度算子融合/算子优化等操作 快速适配工具 FastPT AI框架 PyTorch/TensorFlow/JAX/Paddle/� 精度检测工具 LayerCheck 图优化组件 GraphRay 通用推理框架 ONNXRuntime/MIGraphx/� 融合算子库 LightOP 算子模板库 CUTLASS AI编译 Triton/XLA 大模型训练组件 大模型推理组件 通用训练组件 Apex Torchvision PyTorch Scatter MMCV ... Torchaudio PyTorch Cluster FlashAttention Megatron-LM Transformer Engine Bitsandbytes FastMoE DeepSpeed Diffusers vLLM PageAttention Ollama LMDeploy ... FlashMLA LMSlim KTransformers ... 行业应用 政务 金融 科教 能源 互联网 电力 税务 医疗 ... 算力 基础设施 弹性计算平台适配 k8s-dcu-plugin k8s-vdcu-plugin dcu虚拟化组件 性能监控组件 故障诊断组件 海光CPU 海光DCU IB RoCE 分布式存储 对象/文件/块存储 DAP 大模型 平台 知识库 混合排序 知识解析 检索增强 知识切片 问答测试 知识索引 Agent 画布编排 模型节点 记忆设置 HTTP节点 提示词 组件节点 大模型应用创新平台 数据库 text2sql 数据表 可视化 数据库 能力组件 预定义组件 MCP调用 DAP 大模型 平台 云原生AI平台 模型推理服务 大模型 推理加速 大模型 分布式推理 模型 纳管 模型微调 微调 算法 模型 评估 模型训练加速 大模型 训练加速 大模型 分布式训练 数据处理 模型微服务 数据 标注 多数据 源支持 数据 批处理 标准API 高效推理引擎 优化的模型 容器化部署 DAP人工智能应用平台定位于企业级大模型开发平台,致力于帮助客户快速搭建个性化知识库问答系统,通过自定义的工作流,完成 用户特定的业务应用场景,在人工智能应用领域独具特色。 DAP提供对话引擎、企业知识库引擎、Agent编排引擎等能力矩阵,同时具备完善的企业级产品特性,包括精细化用户管理,SSO单点 登录、多模型纳管、负载均衡等。 功能整合 支持处理各个格式文件 以及http调用第三方接口 可视化工作流 简单拖拽即可定制复杂逻辑 常用模块可封装复用 技术特性领先 方便开发者快速集成各类功能 便于与其他系统或应用集成 降低幻觉率 支持多个知识库的混合使用与 高效检索确保回答全面准确 HYGON 11 12 HYGON 海光DCU行业实战手册 海光DCU应用场景 APPLICATION SCENARIOS DAP人工智能应用平台 实战场景一:AI大模型一体机 基于海光DCU的大模型一体机 海光信息秉承“深算智能”战略,以C86 CPU+DCU异构加速计算平台为核心,发挥“全精度通用架构、兼容主流AI生态、开放开源合 作”等优势,倾力打造“DCU-DTK-DAS-DAP”全栈软硬件技术生态体系,支撑各类大模型适配优化与应用创新,助力千行百业智能 化转型。 全尺寸、多形态、多场景适配各种大模型,从十亿推理到千亿训练灵活扩展 1.5B 7B/8B 14B 32B 70B 671B 小并发推理、单一场景推理 个人智能助手 多任务处理 部门/团队应用 复杂推理,小模型微调 中小企业服务 模型微调,大并发推理 企业级应用服务 桌面级AI工作站 支持14B以下模型推理 AI推理服务器 支持70B模型推理 训推一体AI服务器 支持70B模型推理 +14B模型微调 柜级训推一体服务器 支持671B模型推理 +70B模型微调 千卡集群方案 支持在两周内完成 671B模型预训练 方案亮点 / HIGHLIGHTS 实施效果 / IMPLEMENTATION RESULTS 海光与天翼云联合推出基于海光DCU的智算一体机,通过整合天翼 云翼政通等智能AI应用、云管平台以及推理管理平台,支持接入主流 大模型驱动定制化功能,结合主流大模型实现一站式快速交付。 性能卓越:海光DCU与天翼云智能AI软件深度协同,满足复杂业 务场景需求,带来精准高效的AI应用体验。 灵活拓展:海光DCU全面兼容主流AI框架,推动业务快速上线, 并为客户自主研发预留弹性算力空间。 安全自主:采用海光DCU+CPU的全国产化方案,为私有化部 署提供数据保护,具备模型推理全流程的隐私防护能力。 基于海光DCU打造智算一体机 中国电信天翼云 背景需求 / BACKGROUND 随着AI技术的快速发展,行业客户在智能化转型的过程中面临 应用场景模糊、试错成本和算力成本高昂等一系列问题。 针对这些问题,需通过算法框架优化、加速库升级和软硬件 全栈调优,构建起从模型微调、推理服务到智能体编排应用 的全流程解决方案。 HYGON 13 14 HYGON 海光DCU行业实战手册 软硬一体化交付,全流程自动化部署,真正实现开箱即用, 大幅缩短项目落地时间。 海光硬件与天翼云软件深度融合,方案性能强劲、稳定可 靠,已通过各行业客户的现网验证,能够提供坚实的可靠性 保障。 一体机一站式交付,简化前期建设投入,助力客户快速接入 大模型,拥抱AI时代。 持续落地重庆市某区政府、湖南某市政务云、肇庆某三甲医 院、南宁市某局等地。 方案亮点 / HIGHLIGHTS 实施效果 / IMPLEMENTATION RESULTS 浙江算力科技通过打造“1个中枢+2个数智产品”架构,在海光DCU上 实现算力、数据、算法全要素整合,赋能杭州某重点区县上线全国首个 深度融合浙政钉的AI政务智能体。 城市大脑中枢架构:整合海光DCU算力、多源城市数据与AI算 法,构建支持实时决策的智能运算平台。 双数智产品体系:开发城市运行管理智能体与政务办公智能 体,实现城市治理与行政服务的双轨智能化。 全栈国产化适配:信创云底座部署海光DCU,完成AI算力平台 与浙政钉系统的深度集成。 快速交付能力:利用海光DCU高兼容性特性,实现应用适配周 期缩短50%。 携手海光DCU团队推出AI政务智能体 浙江算力科技 背景需求 / BACKGROUND 城市智能化升级需求迫切,需通过智能中枢实现跨部门数据融合 与决策协同,解决传统城市管理响应滞后、资源调度低效问题。 现有电子政务系统难以支撑智能化服务,亟需AI驱动的工作流 重构提升行政效能。 响应国家信创战略,需在政务领域实现从算力基础设施到应用系 统的全栈国产化替代。 助力杭州建设"全国数字经济第一城",需形成可复用的智能城 市技术输出能力。 HYGON 15 16 HYGON 海光DCU行业实战手册 方案亮点 / HIGHLIGHTS 实施效果 / IMPLEMENTATION RESULTS 海曦技术基于海光DCU与国产大模型打造心理筛查一体机,首创游 戏化多模态无感采集技术,突破传统心理筛查的局限,实现75%的病 症识别准确率,交付国内首个深度融合行为分析与AI诊断的心理健康 筛查平台。 数据长期跟踪与发展性评估:建立学生心理成长档案库,通过随 机截距交叉滞后模型分析学业成绩与心理状态的动态关联,识 别心理健康问题的关键发展节点。 自动化报告生成:系统自动生成多维度可视化报告(如心理状 态雷达图、风险因子权重分析),并提供可操作建议(如推荐干 预课程、家校沟通话术)。 结束了传统心理检测技术(问卷、沙盘等)一统天下的局面, 在大模型和多模态技术的加持下,青少年心理筛查的手段变 得更加友善、更加科学。 帮助医院、学校及时发现和解决学生的心理问题,从而有效 预防校园抑郁、自闭、欺凌、自杀等事件的发生,为平安校园 建设提供有力支持。 方便学校和教育机构随时随地进行数据查询和分析,有效提 升心理健康教育的针对性和实效性。 联合海光打造开箱即用、全栈交付的心理筛查一体机 海曦技术 背景需求 / BACKGROUND 传统筛查手段失效:问卷/沙盘等方式易引发学生抵触,数据真 实性存疑,且难以捕捉隐性心理问题。 隐私与效率双重挑战:需在保护未成年人隐私前提下,实现大 规模快速精准筛查。 技术国产化需求:突破国外技术垄断,构建自主可控的心理 健康评估技术体系。 校园心理危机预警缺位:缺乏高效工具预防抑郁、自闭、欺凌 及自杀事件,校园安全管理存在盲区。 在杭州某重点区县上线全国首个“AI公务员”系统,实现政策咨 询、事务办理等7类场景智能响应。 城市管理效能跃升,跨部门协同决策时效压缩至分钟级。 建成浙江省首个信创云AI政务平台,海光DCU算力资源利用率 高效。 海光DCU通过良好的生态合作,助力某股份制银行建设国产AI虚拟化 算力资源池,高效适配AI厂商产品,形成基于“海光DCU+先进算力池化 技术+算力管理平台”的联合技术方案 某国有股份制商业银行顺应“人工智能+”的国家战略,结合AI 解决方案推进数字化基础设施升级。 要求IT资源集约化管理,需实现国产算力和非国产算力统一调 度以及多种框架
| ||
下载文档到本地,方便使用
- 可预览页数已用完,剩余
23 页请下载阅读 -
文档评分


新能源行业光储能微电网能量管理系统解决方案(50页PPT)