华为昇腾DeepSeek解决方案GRPO :群体进化的智慧筛选器 自我验证机制: AI 的 " 错题本系 统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA :空间压缩术 训练框架加速: 16 到 3 的量化压 缩, 通信降低 89% 推理加速:预加载,动态批处理等 模型、数据、工具链、部署全开源 蒸馏技术使能第三方模型性能 DeepSeek V3 :实现极致性能,稀疏 MOE 提质 降本 技术创新 ,需要存两份参数来进行训练( Parameter 2x ) • 模型总参数量 671B ,每个卡上 4 个 routed expert 对应 26.8B , 同时 考虑到 PP-16 和 FP8 量化 ,每个卡上显存占用为 1.675GB 参考 DualPipe 技术,基于 MindSpeed 训练加速框架以及昇腾硬件特性,针 对 性地设计高效率流水并行技术,提升整体训练性能 Huawei Proprietary MindIE-Server MindIE-LLM 对标 TensorRT-LLM • 支持社区模型快速迁移 • 自回归解码、扩散过程优化 • 稀疏量化压缩、 并行推理 对标 TensorRT • 图优化,算子融合, Kernel 优 化 • 量化、混合精度加速 • 异步下发,多流水执行 第三方推理服务 3rd 支持 PyTorch / 昇思 • 少量代码实现训练向推理平滑迁 移0 积分 | 32 页 | 2.52 MB | 9 月前3
英特尔-工业人工智能白皮书2025年版同样便于 AI 推理,可提高 AI 工作负载常用数学运算的并行程度。该平台还通过英特尔® 深度学习加速技术 (英特尔® DL Boost)和 VNNI 指令支持基于硬件的 AI 加速,通过 Int8 量化实现强大的 AI 性能。平台支持英特尔® 发行版 OpenVINO™ 工具套件,可提供优化的性能,同时帮助开发人员对常见用例进行 AI 模型预训练,从而加快上市时间。 2.1.1 第 12 代英特尔® 性能。开发者可以使用英特尔® oneAPI 基础工具包和英特尔® oneAPI 高性能计算工具包,更容易地构建、分析、优化和扩 展通用计算、高性能计算和 AI 应用程序,跨越多种类型的架构,并使用包括在向量化、多线程、多节点并行化和内存优化 方面的最先进技术。使用英特尔® 至强® Max 系列处理器和英特尔® oneAPI,开发者可以轻松构建高性能、多架构软件,为 高性能计算做好准备。 适用于不同 DPC++ / C++ 编译器的 FPGA 支 持包 英特尔® 高性能计算工具包 针对高性能计算应用程序开发者,英特尔® 高性能计算工具 包提供了所需的优化、分析和扩展应用程序所需的技术,包 括向量化、多线程、多节点并行化和内存优化等。这个工具 包是对英特尔® oneAPI 基础工具包的补充,包括以下工具: • 英特尔® Fortran 编译器 • 英特尔® Fortran 编译器经典版0 积分 | 82 页 | 5.13 MB | 9 月前3
山东大学:DeepSeek 应用与部署搭建本地知识库 • 在 AnythingLLM 左侧工作区找到上传按钮 ,选中要上传的文档 ,点击移动到工作区 ,再点击“ Save and Embed” ,对文档进行切分和词向量化。 完成后 • ,点击图钉按钮 ,将文档设置为当前对话的背景文档 ,即可在聊 天窗口基于上传的文档内容与模型进行对话 本地部署方法 Ollama+Deepseek LM Studio+DeepSeek10 积分 | 79 页 | 6.52 MB | 9 月前3
AI跃迁派:2025年DeepSeek零基础完全指南⚫ 语音输入:长按麦克风图标口述问题(适合通勤场景) ⚫ 离线缓存:断网时可查看历史对话记录 避坑指南:若遇安装失败,检查存储空间是否充足,或关闭杀毒软件后重试 ③微信小程序(轻量化入口) 获取路径: 1.微信搜索"DeepSeek"公众号 2.后台发送关键词【小程序】获取专属链接 ⚫ 优势:无需注册,微信一键登录,适合快速查询天气、新闻等简单任务 ⚫10 积分 | 21 页 | 1.01 MB | 9 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告预测多个Token来减少计算量, 从而提高推理速度。 [1] DeepSeek-V3 技术报告 https://arxiv.org/pdf/2412.19437v1 FP8 混合精度的整体训练思路 细粒度量化策略 71 拓展分析: DeepSeek-V3 ➢ 通信优化:DulePipe 算法: 精细化编排计算和通信 ➢ 控制前向和反向过程中 计算和通信的GPU SM 数量,保证计算和通信 完全重叠10 积分 | 76 页 | 8.39 MB | 9 月前3
共 5 条
- 1
