ppt文档 DeepSeek华为云AI解决方案 VIP文档

850.86 KB 16 页 0 下载 48 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
DeepSeek 华为云 AI 解决方案主打胶 片 Security Level: 目录 1. DeepSeek 介绍和洞察 2. DeepSeek 华为云部署方案 3. DeepSeek 应用场景 3 Huawei Proprietary - Restricted Distribution d e e p seek 全球增长最快应用,增长势头超越 ChatGPT 截止 2.5 号,上线不到一个月 DeepSeek 日活跃用户数已突破 2000 万,达到 2215 万,全球下载量接近 4000 万; DeepSeek 的访问量达到了创纪录的 4900 万次,比前一周增长了 614% 华为云合作 DeepSeek V2 发布 价 格低 于 同行 , 在滑 铁 卢大 学 老 虎 实 验 室 的 LLM 排 名 中 位 列 第 七 华 为 云 开 始 与 DeepSeek 合 作,并在 12 月业务上量 11.2 11.29 ● ● DeepSeek coder 发布 LLM 发布聊天版本 2023 年 8 月 2024 年 5 月 DeepSeek R1-Lite- Preview 发布 宣称在逻辑推理、数学推理和实 时 问题 解决 等任 务上 超越 OpenAI O1 ,但《华尔街日报》测试发现 OpenAI O1 在部分问题上更快。 12.26 DeepSeek R1 发布 比肩 OpenAI o1 ,支持模型蒸馏, 国产 AI 迎来里程碑时刻 n 1 月底, DeepSeek 在苹果应用商店中霸占了 157 个国家 / 地区的第一名位置,其中包括美 国这一重要市场。 n 1 月底, DeepSeek 遭受黑客攻击, 美国科技 股蒸发万亿 n 2 月 1 日 : DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行 榜上 名列前茅。 DeepSeek 时刻,云巨头集中接入 • 微软、英伟达、亚马逊全部接入 DeepSeek • 华为云、腾讯云、百度智能云、阿里云也先后接 入 DeepSeek 相关大模型 DeepSeek 历程: 23 年 5 月成立持续走开源道路, 24 年底发布 AI 核弹级产品震 惊全球 DeepSeek-V3 发布 671B 亿参数, 仅 55 天训练 ,十分之 一 的成本,( 558 万美元) ,超越 Llama 3.1 和 Qwen 2.5 ,与 GPT - 4 O 相当。 发 布 首 个 模 型 DeepSeek coder , 免 费供 商 业使 用 且完 全 开源 推 出 DeepSeek LLM , 参 数 规 模 达 670 亿,同时发布聊天版本 DeepSeek Chat 。 DeepSeek 成立 由对冲基金幻方量化实际控 制人梁文峰成立 High-Flyer 幻方量化 对 冲基 金 、量 化 基金 和 人工 智能公司,成立于 2015 年。 DeepSeek 下载量霸占 165 多个国家榜 首 2024 年 11 月 2023 年 5 月 2025.1.20 低成本完美对标 OpenAIO1 ,突破精确语义理解及复杂推理任务 数学 + 编程领域大幅领先, DeepSeek-V3 训练成本不足 Meta/OpenAI 的 10% , DeepSeek-R1 推理成本仅为 OpenAI o1 的 3% ,成为开源模型 SOTA 。 低成本 性能优 技术创新 数学、科学和代码等领域领先业界, 成为业界公认的 LLM 的领先模型 来源: DeepSeek 模型测试数据 & 互联网 • 绕过 CUDA 进行 PTX 编程 • 计算与通信优化,性能提升 30% • GRPO :群体进化的智慧筛选器 • 自我验证机制: AI 的 " 错题本系 统 " • 混合专家模型的 " 智能路由器“ • 多头潜在注意力 MLA :空间压缩 术 • 训练框架加速: 16 到 3 的量化压 缩, 通信降低 89% • 推理加速:预加载,动态批处理 等 • 模型、数据、工具链、部署全开 源 • 蒸馏技术使能第三方模型性能 DeepSeek 大模型解读: 通过系统优化实现极致性能, 完全开源 + 免费商用,挑战 A 国 AI 霸权 硬件级、算法级、架构级、工程级、开 源生态 5 大技术创新,轰动全球 绕过 CUDA 挖掘 FP8 硬件潜力 , MOE 和 MLA 技术实现不到 10% 的 成本方案 ~150M$ Llama3.1-405B 训练 成本 5.57M$ DeepSeek-V3 训 练成本 DeepSeek-R1 推理成本仅为 OpenAIo1 的 3% 算法革命 工程奇迹 开源生态 硬件级优化 架构创新 Huawei Proprietary - Restricted Distribution 4 目录 1. DeepSeek 介绍和洞察 2. DeepSeek 华为云部署方案 3. DeepSeek 应用场景 销售场景 场景一 在昇腾云裸金属服务器部署 DeepSeek 模型 场景二 MaaS ( ModelArts Studio )平台 DeepSeek 模型 场景三 开发者基于 DeepSeek 应用 Demo 打通 典型客户 腰部重点客户,以及模型服务提 供商 AI ISV , AI 行业场景应用创业公司,人工智能研究院 开发者、中小企业尝鲜客户 部署模型 DeepSeek-V3 DeepSeek-R1 DeepSeek-V3 DeepSeek-R1 DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Qwen-1.5B DeepSeek-R1-Distill-Qwen-7B DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Qwen-14B DeepSeek-R1-Distill-Qwen-32B DeepSeek-R1-Distill-Llama-70B 业务体验 专属资源 专属资源 / 公共资源 专属资源 / 公共资源 可销售 Offering 卖昇腾云算力 + 专业服务 ModelArts Lite/ModelArts Standard+ 昇腾云迁移适配 /AI 平台架构规划服务 卖 MaaS 服务 华为云 ModelArts Studio Flexus X/GPU 一键部署 Ollama- Deepseek 模 型 销售量纲 包月 / 年(需开白名单) 按需(需开白名单) 、包月 / 年,每个模型可免费体验 200wtokens 按需、包月 / 年 典型配置 昇腾云部署: DeepSeek-V3 和 DeepSeek-R1 : 32 卡 910B 起步,根据推理并发量配置 DeepSeek-R1-Distill-Qwen-32B : 2 卡 910B 起步,根据推理并发量配置 DeepSeek-R1-Distill-Qwen-14B 和 -Distill-Llama-8B : 1 卡 910B 起步,根据推理并发量配置 DeepSeek-R1-Distill-Qwen-1.5B : 4u4g Flexus X 实例 DeepSeek-R1-Distill-Qwen-7B&Llama-8B : 16u16g Flexus X 实例 更大尺寸模型: Nvidia GPU 实例(需开白名单) 相关链接 https://console.huaweicloud.com/modelarts/?locale=zh-cn&region=cn-east-4#/model- studio/deployment 中国站::华东二( DeepSeek-R1-Distill ), 西南贵阳一( DeepSeek-R1-Distill , DeepSeek-R1&V3 ) https://www.huaweicloud.com/solution/implementati ons/building-a-deepseek-lnference-system.html 中国站:北京四,上海一,华南广州 国际站:土耳其,香港 华为云 DeepSeek 三大部署场景全景 图 一、方案简介:面向腰部重点客户,以及模型服务提供商等需要独立部署 DeepSeek 全尺寸模型 R1&V3 的场景 • 基于华为云 ModelArts Lite&Standard 部署 DeepSeek R1&V3 全尺 寸模型 DeepSeek R1&V3 昇腾 910 系列 AI 计算超节点集群 3. 核心优势 方案核心优势 灵活部署: 提供 ModelArts Lite (裸金属服务器)和 ModelArts Standard ( Console 平台)两 种方 式部署。 DeepSeek 模型 云服务 卡数 包月(元 / 月) R1 ModelArts Lite&Standard 32 卡起步 606480 V3 ModelArts Lite&Standard 32 卡起步 606480 场景 1 :基于 ModelArts Lite/Standard 部署 DeepSeek R1&V3 全尺寸模 型 虚拟机 / 裸金属 2. 卖什么 offering 通过私有部署 DeepSeek-R1 模型按需 / 包月费用预估如下, Tokens/s 为单 并发 1. 是什么 解决方案架构 ElasticServer ElasticCluster 一、方案简介:面向 AI ISV , AI 行业场景应用创业公司,人工智能研究院 等客户,提供开箱即用的模型 API 服务 • 基于华为云 ModelArts Lite&Standard 部署 DeepSeek R1&V3 全尺 寸模型 DeepSeek 模型 云服务 卡数 按需(元 / 小时) 包月(元 / 月) R1 ModelArts Studio 32 卡起步 1263.5 606480 V3 ModelArts Studio 32 卡起步 1263.5 606480 R1-Distill-32B ModelArts Studio 2 卡起步 68.7 / R1-Distill-14B ModelArts Studio 1 卡起步 34.35 / R1-Distill-8B ModelArts Studio 1 卡起步 34.35 / 3. 核心优势 方案核心优势 开箱即用: 提供开箱即用的 MaaS API 服务,客户轻松对接业务需求。 多重计费方式: 按需 / 包周期计费方式均可使用 场景 2 :基于 ModelArts Studio 部署 DeepSeek V3& R1& R1-Distill 模 型 2. 卖什么 offering 通过私有部署 DeepSeek-R1 模型按需 / 包月费用预估如下, Tokens/s 为单 并发 1. 是什么 解决方案架构 解决方案架构 一 、方案简介: 面向开发者、企业等需要独立部署 DeepSeek 推理系统 的场景 • 基于华为云 Flexus 云服务器 X 实例(弹性云服务器 ECS )上快速搭建 DeepSeek-R1:1.5B 和 7B 轻量级推理系统 • 基于华为云 GPU 服务器上快速搭建 DeepSeek-R1:7B 和 8B 、 14B 等推 理系统 DeepSeek -R1 模型 方案 云服务 系统 盘 GB 数量 包月(元 / 月) 按需 ( 元 / 小 时 ) Tokens/s 1.5B 方案 1 X 实例 x1.4u.4g 40 1 271.30 0.38 13 7B 、 8B 方案 1 X 实例 x1.16u.16g 1 676 1.3888 11 方案 2 GPU-G5R 16U32GB 显卡 1*16G 1 3905.8 13.32 60 方案 3 GPU-pi5 16U64GB 显卡 1 * 24G `1 4018 8.2 43 14B 方案 1 GPU-G5R 16U32GB 显卡 1*16G 100 1 3,947.80 13.377 33 方案 2 GPU-pi5 16U64GB 显卡 1 * 24G 1 3,945 8.17 24 32B 方案 1 GPU-pi5 16U64GB 显卡 1 * 24G 100 1 3,945 8.17 12 70B 方案 1 GPU-pi5 32U128GB 显卡 2 * 24G 200 1 7,890 16.34 5 3. 核心优势 方案核心优势 低成本: 提供高性价比的云服务器,用户可以根据实际需求自定义不同规格的云服务器。 一键部署: 一键轻松部署,即可完成云服务器及公网 IP 等资源的快速下发和 DeepSeek-R1 蒸 馏 版模型的搭建。 场景 3 :基于云服务器私有化部署 DeepSeek-Distill 模 型 2. 卖什么 offering 通过私有部署 DeepSeek-R1 模型按需 / 包月费用预估如下, Tokens/s 为单 并发 1. 是什 么 目录 1. DeepSeek 介绍和洞察 2. DeepSeek 华为云部署方案 3. DeepSeek 应用场景 10 检索增强生成 RAG ,提高回答问题准确度 • 本 地 知 识 库 检 索 : 内 置 强 大 的 知 识 库 能 力 , 导 入 您 的 知 识 文 档 即 可 实 现 基 于 私 域 知 识 的 对 话 助 手 • 联 网 检 索 : 内 置 联 网 插 件 , 可 实 现 大 模 型 联 网 搜 索 的 能 力 支持多种交互形态,提升用户体验 • 语 音 交 互 : 精 准 的 语 音 转 写 能 力 , 支 持 大 容 量 热 词 定 制 , 可 方 便 快 捷 提 升 特 定 场 景 识 别 率 • 数字人 : Deep Seek + 知识库 + 联 网 搜 索 的 数 字 人 大 脑 让 数 字 人 既 懂 私 域 知 识 也 懂 外 部 知 识 ; 数 字 人 口 型 更 精 准 , 业 界 领 先 MaaS API (适配 Open AI API ) 昇腾服务器集群 ModelArts Studio ( MaaS ) Ollama API 基于 GPU 一键部署 Gpu 实例 / Flexus 云服务器 X 实例 用户问题 RAG 本地知识库 互联网 Flexus 云服务器 X 实例 基于 DeepSeek 搭建应用场景解决方 案 安全防护 高效存储 推理加速 模型应用 文字交互 语音交互服务 SIS 数字人服务 用户 11 项目 方案 服务大类 服务子类 计费模式 DeepSeek 部署 方案 1 ModelArts ModelArts Studio ( MaaS ) 包周期 / 按需 方案 2 计算 Flexus X 实例 包周期 / 按需 GPU 包周期 / 按需 Dify 工作流平台 部署 / 计算 Flexus X 实例 包周期 / 按需 1. DeepSeek 性能卓越,用户体验佳,拥有强大的自然语言处理能力, 其思维链的特性进一步强化了上下文对话能力。 2. Dify 内置联网搜索插件,可实现大模型联网搜索的能力 知识的对话助手 基于 华为云 Flexus X 实例(部署 Dify 工作流平台) + DeepSeek 构建的 DeepSeek 联网 + 知识库助手,使得 DeepSeek 具备更多客户私域知识和 外 部知识,提高 DeepSeek 模型落地能力,此外工作流平台还可以进行意 图 理解等强大功能,拓展 DeepSeek 智能助手能力边界。 AI 行业场景应用创业公司 / 人工智能 ISV/ 人工智能研究 院 高校和 AI 培训机构 中型传统企业(需要企业内部问答助手) 目标客户 方案核心优势 DeepSeek 联网助手解决方案一指 禅 2. 卖什么 offering
下载文档到本地,方便使用
- 可预览页数已用完,剩余 15 页请下载阅读 -
文档评分
请文明评论,理性发言.