V3 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

chenweiguang@dgzq.com.cn 电子行业指数走势资料来源：东莞证券研究所，Wind 相关报告投资要点：  DeepSeek推动模型平权，关注AI终端及算力领域。2024年12月，DeepSeek V3 首个版本上线，在多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型，并在性能上和 GPT-4o 以及 Claude-3 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩，四大科技巨头Q4资本开支合计同比大幅增长77%，主要支持云计算、AI等基础设施建设。同时后续资本开支指引积极，海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐，反而加大相关投入，而国内 CSP为了保持竞争优势亦有望跟进，增加AI领域相关投入。同时AI应用场景加速普及，也将反哺算力需求。  风险提示：终端需求不 ......14 图 27 ：雷鸟创新 V3 拍摄眼镜 .......................................................... 15 图 28 ：雷鸟创新 AI 下棋实时指导功能 .................................................. 15 图 29 ：雷鸟创新 V3 支持边充边用 ............

10 积分 | 23 页 | 2.65 MB | 1 年前
3
面向审计行业DeepSeek 大模型操作指南（27页 WORD）

领域取得了显著成果，主要使用数据蒸馏技术，得到更为精炼、有用的数据。 2024 年 1 月 5 日，发布 DeepSeek LLM（深度求索的第一个大模型），目前， DeepSeek-R1 、V3 、Coder 等系列模型已上线国家超算互联网平台。英伟达称， DeepSeek-R1 是最先进的大语言模型，亚马逊和微软也接入 DeepSeek-R1 模型。 DeepSeek 大模型在 Sonnet ）不相上下。 DeepSeek 被业界认为“ 以高性价比著称的 AI 模型服务商”，原因是这家公司的出现极大地降低了大模型训练和应用的成本，如该公司开发的 DeepSeek- V3 训练成本仅 557.6 万美元，而 OpenAl 训练 GPT-4 所花费的成本高达 7800 万美元甚至是 1 亿美元，双方的成本相差至少 10 倍。DeepSeek-V3 在数学、代码能力即可。图 1 DeepSeek 注册页面登录成功后，进入图 2 “ 所示界面，然后点击开始对话 ”就可以使用。图 2 DeepSeek 官方网站主界面不过需要注意，那就是如何选择 V3 还是 R1 模型，可以参考下图。此外还 “ 可根据需要，选择是否勾选联网搜索 ”。图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用手机版的使用和电脑版基本一样，根据需要是否激活

0 积分 | 27 页 | 829.29 KB | 6 月前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

2*107 DeepSeek v3 2024 年 12 月 2.8*106 5.6*106 DeepSeek V3 公开的单次极低预训练成本 DeepSeek 全部训练单次成本： 5,576,000 美元单张 H800 GPU 每小时租赁成本： 2 美元泛大模型 / 指标 DeepSeek V1 DeepSeek V2 DeepSeek V3 Llama 3.1 0 OO00 1 ■ DeepSeek V3 模型参数 ? 671B 参数 (GPT-3:175B 、 GPT-4:1.76T?) ■ 每个 token 激活 3 7B 参数 (~5.5%), 降低计算量 MoE: 1 共享专家 + 256 路由专家 MLA: 低秩压缩 DeepSeek v3 模型参数 L=61 层 oo oouatence9 ■ 以中国的工业化水平，站着把 Al 的钱给挣了。 ■ “健身可以让 SB 跟你好好说话”→ ■“ 突破模型、算力卡脖子可以让 A 国跟咋们好好说话” DeepSeek V3 未来展望

10 积分 | 23 页 | 7.53 MB | 1 年前
3
华为昇腾DeepSeek解决方案

蒸馏技术使能第三方模型性能 DeepSeek V3 ：实现极致性能，稀疏 MOE 提质降本技术创新硬件级、算法级、架构级、工程级、开源生态 5 大技术创新，轰动全球低成本绕过 CUDA 挖掘 FP8 硬件潜力， MOE 和 MLA 技术实现不到 10% 的成本方案 ~150M$ 5.57M$ DeepSeek–V3 训练成本 Llama3.1-405B 北京、南京、西安、武汉、苏州、无锡等公共服务平台已上线招行测试中工行测试中太保测试中模型名称 Atlas 300I Duo Atlas 800I A2 DeepSeek V3 - √ DeepSeek R1 - √ DeepSeek Janus-Pro-1B/7B √ √ DeepSeek R1-Distill-Llama-70B - √ DeepSeek R1-Distill-Qwen-32B DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Qwen-7B 模型参数： 671B+ 满血版 DeepSeek V3/R1 模型参数： 70B DeepSeek-R1-Distill-Llama-70B AI 编程智能对话金融研报文本创作营销文案内容检测 Atlas 800I A2 (1024GB)

0 积分 | 32 页 | 2.52 MB | 1 年前
3
山东大学：DeepSeek 应用与部署

2023 — DeepSeek ：技术创新——模型架构 | V2 （ Multi-Head Latent Attention ） DeepSeek ：技术创新—模型架构 | V3 PPO ： Proximal Policy Optimization GRPO ： Group Relative Policy Optimization 强化学习让智能体（ Agent ）在环境阿里云百炼：提供多个 DeepSeek 系列模型，如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等，部分限时免费，涵盖文本生成等功能。 • 百度智能云：千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用，且限时免费，其模型在百科知识、数学推理等任务表现突出。 • Distill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-7B DeepSeek DeepSeek-R1 - Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio ：登录腾讯云官网，进入 Cloud Studio ，可一键部署，即开即用，能快速体验 7B 以下

10 积分 | 79 页 | 6.52 MB | 1 年前
3
DeepSeek消费电子行业大模型新型应用最佳实践分享

长上下文 (64~128K) 超大模型启动加速独享 GPU 算力集群私有 API 服务调用高并发、高可用企业级鉴权流控算力投入持续降低 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 256 卡 H20 • 全参 SFT • 8 小时蒸馏后模型多模式精调 • 全参 +LoRA 双模式 • 低至 1 卡 A10 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 能力，零代码 / 低代码构建业务流程。其中参数提取节点，支持多参数同时提取、基于对话历史进行多轮反问澄清等优势能力，对话效果更优势。大模型相关的节点均接入 DeepSeek R1 和 V3 模型，可支持自由选择和切换。大模型知识引擎“工作流” : 支持用户快速编排复杂应用面向复杂业务流程场景，升级复杂应用构建能力 2. 信息处理节点均已支持 DeepSeek 模型 1.

10 积分 | 28 页 | 5.00 MB | 1 年前
3
浙江大学：DeepSeek的本地化部署与AI通识教育之未来

正式上线DeepSeek-V3首个版本并同步开源 2025.1.31: DeepSeek-R1模型登陆英伟达 NVIDIA NIM，同时：接入亚马逊、微软... 2025 2024 2025.2.5: DeepSeek-R1、V3、Coder 等系列模型, 陆续上线国家超算平台... 2025年1月：GitHub发布Janus-Pro多模态大模型，进军文生图 2025.2.6日: 中国电信、中国移动、中国联通三大运营商宣布接入DeepSeek deepseek-r1:8b • ... 1.DeepSeek简介 26 DeepSeek 手机版的扫码安装和简单使用（手机里面使用） 27 DeepSeek的部署 v Deepseek系列模型包括V3（671b）、R1（660b）和基于DeepSeek-R1蒸馏的模型,如下表。 v 教育和科学领域任务需求，包括智能问答系统、学习辅助工具、数据分析助手、论文摘要生成等任务，可以基于deepseek R1-14b 24GB+ 64GB+ 30GB 专用服务器 R1-32b 48GB+ 128GB+ 60GB GPU服务器 R1-70b 80GB+ 256GB+ 120GB GPU服务器 V3\R1-671B （MoE） 4*A100 GPUs （320GB VRAM） 512GB 500GB+ 高端GPU服务器 v DeepSeekR1蒸馏版均可进行本地化部署。 v 小规模的1

10 积分 | 57 页 | 38.75 MB | 1 年前
3
电子AI+系列专题：DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求

公司成立于 2023 年 7 月，是一家致力于实现通用人工智能 (AGI) 的创新型科技公司。 2024 年 12 月， DeepSeek-V3 发布，性能对齐海外领军闭源模型。据官方技术论文披露， V3 模型的总训练成本为 557.6 万美元，对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月， DeepSeek-R1 发布，性能对标 OpenAI-o1 正式版。在数学、代码、英伟达、亚马逊等已先后上线部署支持用户访问 DeepSeek-R1 模型。 2 月 1 日，华为云官方发布消息，硅基流动和华为云团队联合首发并上线基于华为云昇腾云服务的 DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE 实现高效的推理和低成本训练，构建 DualPipe 算法和混合精度训练优化计算与通信负载；通过 ( 分阶段 ) 强化学习实现里 Qwen2.5-72B 、 Meta 的 Llama-3.1-405B 等其他开源模型，并逼近 GPT-4o 、 Claude-3.5-Sonnet 等顶尖闭源模型。据官方技术论文披露， V3 模型的总训练成本为 557.6 万美元，对比 GPT-4o 等模型的训练成本约为 1 亿美元。 l 2025 年 1 月， DeepSeek-R1 发布，性能对标 OpenAI-o1 正式版。

10 积分 | 38 页 | 1.95 MB | 1 年前
3
DeepSeek华为云AI解决方案

（ Console 平台）两种方式部署。 DeepSeek 模型云服务卡数包月（元 / 月） R1 ModelArts Lite&Standard 32 卡起步 606480 V3 ModelArts Lite&Standard 32 卡起步 606480 场景 1 ：基于 ModelArts Lite/Standard 部署 DeepSeek R1&V3 全尺寸模型虚拟机寸模型 DeepSeek 模型云服务卡数按需（元 / 小时）包月（元 / 月） R1 ModelArts Studio 32 卡起步 1263.5 606480 V3 ModelArts Studio 32 卡起步 1263.5 606480 R1-Distill-32B ModelArts Studio 2 卡起步 68.7 / R1-Distill-14B

10 积分 | 16 页 | 850.86 KB | 1 年前
3
AI赋能资产配置：DeepSeek对国信多元资配框架的优化

训练阶段应用阶段在 python 中调用 DeepSeek 接口（可选 V3 、 R1 等）初始化自然语言数据懂资配框架的 DeepSeek 资料来源： DeepSeek ，国信证券经济研究所整理基于 Xgboost DeepSeek 接入：通过 API 将 DeepSeek 接入 Python 环境，实现变量和数据框的 AI 加工与动态输出。采用硅基流动基于华为昇腾云的 DeepSeek R1 & V3 推理服务，确保稳定高效的模型训练与推理调用 • 指令的输入：①输入不同时间段的宏观变量和五大短期模型最优权重，助力 AI 掌握模型逻辑与数据映射（静态学习）；②输入实际股债强弱与“先验权重”的偏差，要求 DeepSeek-V3 模型，尚未使用推理能力更强的 DeepSeek-R1 。接入更高性能的大模型有望进一步优化当前配置。（核心问题：现阶段采用硅基流动基于华为昇腾云的 DeepSeek R1 & V3 推理服务，受 TPM 限制（每分钟 Token 数量不超过 15000 ），导致 AI 输出耗时较长。未来通过本地部署大模型，或可在本地构建知识库以提升响应速度和优化能力）指令的优化： Prompt

10 积分 | 33 页 | 2.86 MB | 6 月前
3

共 29 条前往

页

分类

语言

格式

电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

面向审计行业DeepSeek 大模型操作指南（27页 WORD）

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

华为昇腾DeepSeek解决方案

山东大学：DeepSeek 应用与部署

DeepSeek消费电子行业大模型新型应用最佳实践分享

浙江大学：DeepSeek的本地化部署与AI通识教育之未来

电子AI+系列专题：DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求

DeepSeek华为云AI解决方案

AI赋能资产配置：DeepSeek对国信多元资配框架的优化