量化 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

GRPO ：群体进化的智慧筛选器自我验证机制： AI 的 " 错题本系统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA ：空间压缩术训练框架加速： 16 到 3 的量化压缩，通信降低 89% 推理加速：预加载，动态批处理等模型、数据、工具链、部署全开源蒸馏技术使能第三方模型性能 DeepSeek V3 ：实现极致性能，稀疏 MOE 提质降本技术创新，需要存两份参数来进行训练（ Parameter 2x ） • 模型总参数量 671B ，每个卡上 4 个 routed expert 对应 26.8B ，同时考虑到 PP-16 和 FP8 量化，每个卡上显存占用为 1.675GB 参考 DualPipe 技术，基于 MindSpeed 训练加速框架以及昇腾硬件特性，针对性地设计高效率流水并行技术，提升整体训练性能 Huawei Proprietary MindIE-Server MindIE-LLM 对标 TensorRT-LLM • 支持社区模型快速迁移 • 自回归解码、扩散过程优化 • 稀疏量化压缩、并行推理对标 TensorRT • 图优化，算子融合， Kernel 优化 • 量化、混合精度加速 • 异步下发，多流水执行第三方推理服务 3rd 支持 PyTorch / 昇思 • 少量代码实现训练向推理平滑迁移

0 积分 | 32 页 | 2.52 MB | 10 月前
3
英特尔-工业人工智能白皮书2025年版

同样便于 AI 推理，可提高 AI 工作负载常用数学运算的并行程度。该平台还通过英特尔® 深度学习加速技术（英特尔® DL Boost）和 VNNI 指令支持基于硬件的 AI 加速，通过 Int8 量化实现强大的 AI 性能。平台支持英特尔® 发行版 OpenVINO™ 工具套件，可提供优化的性能，同时帮助开发人员对常见用例进行 AI 模型预训练，从而加快上市时间。 2.1.1 第 12 代英特尔® 性能。开发者可以使用英特尔® oneAPI 基础工具包和英特尔® oneAPI 高性能计算工具包，更容易地构建、分析、优化和扩展通用计算、高性能计算和 AI 应用程序，跨越多种类型的架构，并使用包括在向量化、多线程、多节点并行化和内存优化方面的最先进技术。使用英特尔® 至强® Max 系列处理器和英特尔® oneAPI，开发者可以轻松构建高性能、多架构软件，为高性能计算做好准备。适用于不同 DPC++ / C++ 编译器的 FPGA 支持包英特尔® 高性能计算工具包针对高性能计算应用程序开发者，英特尔® 高性能计算工具包提供了所需的优化、分析和扩展应用程序所需的技术，包括向量化、多线程、多节点并行化和内存优化等。这个工具包是对英特尔® oneAPI 基础工具包的补充，包括以下工具： • 英特尔® Fortran 编译器 • 英特尔® Fortran 编译器经典版

0 积分 | 82 页 | 5.13 MB | 10 月前
3
山东大学：DeepSeek 应用与部署

搭建本地知识库 • 在 AnythingLLM 左侧工作区找到上传按钮，选中要上传的文档，点击移动到工作区，再点击“ Save and Embed” ，对文档进行切分和词向量化。完成后 • ，点击图钉按钮，将文档设置为当前对话的背景文档，即可在聊天窗口基于上传的文档内容与模型进行对话本地部署方法 Ollama+Deepseek LM Studio+DeepSeek

10 积分 | 79 页 | 6.52 MB | 10 月前
3
AI跃迁派：2025年DeepSeek零基础完全指南

⚫ 语音输入：长按麦克风图标口述问题（适合通勤场景） ⚫ 离线缓存：断网时可查看历史对话记录避坑指南：若遇安装失败，检查存储空间是否充足，或关闭杀毒软件后重试 ③微信小程序（轻量化入口）获取路径： 1.微信搜索"DeepSeek"公众号 2.后台发送关键词【小程序】获取专属链接 ⚫ 优势：无需注册，微信一键登录，适合快速查询天气、新闻等简单任务 ⚫

10 积分 | 21 页 | 1.01 MB | 10 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

预测多个Token来减少计算量，从而提高推理速度。 [1] DeepSeek-V3 技术报告 https://arxiv.org/pdf/2412.19437v1 FP8 混合精度的整体训练思路细粒度量化策略 71 拓展分析： DeepSeek-V3 ➢ 通信优化：DulePipe 算法：精细化编排计算和通信 ➢ 控制前向和反向过程中计算和通信的GPU SM 数量，保证计算和通信完全重叠

10 积分 | 76 页 | 8.39 MB | 10 月前
3

共 5 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

英特尔-工业人工智能白皮书2025年版

山东大学：DeepSeek 应用与部署

AI跃迁派：2025年DeepSeek零基础完全指南

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告