积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(30)前沿探索(11)行业赋能(9)技术工具(5)大模型技术(4)基础设施(1)

语言

全部中文(简体)(30)

格式

全部PPT文档 PPT(13)PDF文档 PDF(12)DOC文档 DOC(5)
 
本次搜索耗时 0.019 秒,为您找到相关结果约 30 个.
  • 全部
  • 人工智能
  • 前沿探索
  • 行业赋能
  • 技术工具
  • 大模型技术
  • 基础设施
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域

    chenweiguang@dgzq.com.cn 电子行业指数走势 资料来源:东莞证券研究所,Wind 相关报告 投资要点:  DeepSeek推动模型平权,关注AI终端及算力领域。2024年12月,DeepSeek V3 首 个 版 本 上 线 , 在 多 项 评 测 成 绩 超 越 了 Qwen2.5-72B 和 Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。  风险提示:终端需求不 ......14 图 27 :雷鸟创新 V3 拍摄眼镜 .......................................................... 15 图 28 :雷鸟创新 AI 下棋实时指导功能 .................................................. 15 图 29 :雷鸟创新 V3 支持边充边用 ............
    10 积分 | 23 页 | 2.65 MB | 10 月前
    3
  • word文档 面向审计行业DeepSeek 大模型操作指南(27页 WORD)

    领域取得了显著成果,主要使用数据蒸馏技术,得到更为精炼、有用的数 据。 2024 年 1 月 5 日,发布 DeepSeek LLM(深度求索的第一个大模型), 目 前, DeepSeek-R1 、V3 、Coder 等系列模型已上线国家超算互联网平台。英伟 达称, DeepSeek-R1 是最先进的大语言模型,亚马逊和微软也接入 DeepSeek-R1 模型。 DeepSeek 大模型在 Sonnet ) 不相上下。 DeepSeek 被业界认为“ 以高性价比著称的 AI 模型服务商”,原因是这家公 司 的出现极大地降低了大模型训练和应用的成本,如该公司开发的 DeepSeek- V3 训练成本仅 557.6 万美元,而 OpenAl 训练 GPT-4 所花费的成本高达 7800 万 美元 甚至是 1 亿美元,双方的成本相差至少 10 倍。DeepSeek-V3 在数学、代 码能力 即可。 图 1 DeepSeek 注册页面 登录成功后,进入图 2 “ 所示界面,然后点击 开始对话 ”就可以使用。 图 2 DeepSeek 官方网站主界面 不过需要注意,那就是如何选择 V3 还是 R1 模型,可以参考下图。此外还 “ 可根据需要,选择是否勾选 联网搜索 ”。 图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用 手机版的使用和电脑版基本一样,根据需要是否激活
    0 积分 | 27 页 | 829.29 KB | 4 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    2*107 DeepSeek v3 2024 年 12 月 2.8*106 5.6*106 DeepSeek V3 公开的单次极低预训练成 本 DeepSeek 全部训练单次成本: 5,576,000 美 元 单张 H800 GPU 每小时租赁成本: 2 美 元 泛大 模型 / 指标 DeepSeek V1 DeepSeek V2 DeepSeek V3 Llama 3.1 0 OO00 1 ■ DeepSeek V3 模 型 参 数 ? 671B 参数 (GPT-3:175B 、 GPT-4:1.76T?) ■ 每个 token 激 活 3 7B 参数 (~5.5%), 降低计算 量 MoE: 1 共享专家 + 256 路由专家 MLA: 低秩压缩 DeepSeek v3 模型参 数 L=61 层 oo oouatence9 ■ 以中国的工业化水平,站着把 Al 的钱给挣了。 ■ “健身可以让 SB 跟你好好说话”→ ■“ 突破模型、算力卡脖子可以让 A 国跟咋们好好说话” DeepSeek V3 未来 展望
    10 积分 | 23 页 | 7.53 MB | 10 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    蒸馏技术使能第三方模型性能 DeepSeek V3 :实现极致性能,稀疏 MOE 提质 降本 技术创新 硬件级、算法级、架构级、工程级、开 源生态 5 大技术创新,轰动全球 低成本 绕过 CUDA 挖掘 FP8 硬件潜力, MOE 和 MLA 技术实现不到 10% 的 成本方案 ~150M$ 5.57M$ DeepSeek–V3 训 练成本 Llama3.1-405B 北京、南京、西安、武 汉、苏州、无锡等公共 服务平台 已上线 招行 测试中 工行 测试中 太保 测试中 模型名称 Atlas 300I Duo Atlas 800I A2 DeepSeek V3 - √ DeepSeek R1 - √ DeepSeek Janus-Pro-1B/7B √ √ DeepSeek R1-Distill-Llama-70B - √ DeepSeek R1-Distill-Qwen-32B DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Qwen-7B 模型参数: 671B+ 满血版 DeepSeek V3/R1 模型参数: 70B DeepSeek-R1-Distill-Llama-70B AI 编程 智能对话 金融研报 文本创作 营销文案 内容检测 Atlas 800I A2 (1024GB)
    0 积分 | 32 页 | 2.52 MB | 10 月前
    3
  • pdf文档 DeepSeek洞察与大模型应用-人工智能技术发展与应用实践

    DeepSeek不同版本对比 n V3 vs. R1:R1在普通的中文和英文任务上性能小幅领先,在数学和代码等需要深度推理的场景下明显胜出 n R1蒸馏版 vs. R1满血版:在数学、代码等场景下的性能有明显差距,蒸馏版参数量越小,与满血版差距越大 n R1蒸馏版 vs. V3满血版:140亿以上参数的R1蒸馏版的深度推理效果显著强于V3满血版;低参数量R1蒸馏版能力落后 于V3 模型 AIME 2024 a。DeepSeek R1相当于是像 2023年初的OpenAI ChatGPT一样,让所有人真正地感受到了震撼” V3训练开销&R1效果引发全球热议 ChatGPT Llama o1/o3 DeepSeek-R1 首次提出 开源复现 ★ DeepSeek V3效果对标顶级闭源模型,训练成本比LLaMA低一个量级 30.8 2.8 0 20 40 Llama 3.1 AI工具 1、多模态、语音、视觉模型联动 2、挂RAG知识库、联网搜索优化等 3、接入智能体平台 ….. B端生产场景多数重复使用模型某一重复能力, 大量百亿级参数模型即可适用 • DS -V3/R1满血版推理需16-32张910B,LORA微 调需512张910B。大量客户无支持微调的算力。单 任务算力消耗与百亿级参数模型不在同一量级 • DS 最惊艳的R1版,一次推理多在10-20秒,更适合
    10 积分 | 37 页 | 5.87 MB | 10 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention ) DeepSeek : 技术创新—模型架构 | V3 PPO : Proximal Policy Optimization GRPO : Group Relative Policy Optimization 强化学习让智能体( Agent )在环境 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等 , 部分限时免费 ,涵盖文本生成等功能。 • 百度智能云: 千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用 ,且限时免费 ,其模型在百科知 识、 数学推理等任务表现突出。 • Distill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-7B DeepSeek DeepSeek-R1 - Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio :登录腾讯云官网 ,进入 Cloud Studio ,可一键部署 ,即开即用 ,能快速体验 7B 以下
    10 积分 | 79 页 | 6.52 MB | 10 月前
    3
  • ppt文档 DeepSeek消费电子行业大模型新型应用最佳实践分享

    长上下文 (64~128K) 超大模型启动加速 独享 GPU 算力集群 私有 API 服务调用 高并发、高可用 企业级鉴权流控 算力投入持续降低 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 256 卡 H20 • 全参 SFT • 8 小时 蒸馏后模型多模式精调 • 全参 +LoRA 双模 式 • 低至 1 卡 A10 DeepSeek 全系 列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B 能力,零代码 / 低代码构建业务流程。 其中参数提取节点,支持多参数同时提取、 基于对话历史进行多轮反问澄清等优势能 力,对话效果更优势。 大模型相关的节点均接入 DeepSeek R1 和 V3 模型,可支持自由选择和切换。 大模型知识引擎“工作流” : 支持用户快速编排复杂应用 面向复杂业务流程场景,升级复杂应用构建能力 2. 信息处理节点 均已支持 DeepSeek 模型 1.
    10 积分 | 28 页 | 5.00 MB | 10 月前
    3
  • pdf文档 浙江大学:DeepSeek的本地化部署与AI通识教育之未来

    正式上线DeepSeek-V3首个版本并同步开源 2025.1.31: DeepSeek-R1模型登陆英伟达 NVIDIA NIM,同时:接入亚马逊、微软... 2025 2024 2025.2.5: DeepSeek-R1、V3、Coder 等系列模型, 陆续上线国家超算平台... 2025年1月:GitHub发布Janus-Pro多模态大模 型,进军文生图 2025.2.6日: 中国电信、中国移动、中国联通三大运营商宣布接入DeepSeek deepseek-r1:8b • ... 1.DeepSeek简介 26 DeepSeek 手机版的扫码安装和简单使用(手机里面使用) 27 DeepSeek的部署 v Deepseek系列模型包括V3(671b)、R1(660b)和基于DeepSeek-R1蒸馏的模型,如下表。 v 教育和科学领域任务需求,包括智能问答系统、学习辅助工具、数据分析助手、论文摘要生成等任务,可以基于deepseek R1-14b 24GB+ 64GB+ 30GB 专用服务器 R1-32b 48GB+ 128GB+ 60GB GPU服务器 R1-70b 80GB+ 256GB+ 120GB GPU服务器 V3\R1-671B (MoE) 4*A100 GPUs (320GB VRAM) 512GB 500GB+ 高端GPU服务器 v DeepSeekR1蒸馏版均可进行本 地化部署。 v 小规模的1
    10 积分 | 57 页 | 38.75 MB | 10 月前
    3
  • ppt文档 电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求

    公司成立于 2023 年 7 月,是一家致力 于实现 通用人工智能 (AGI) 的创新型科技公司。 2024 年 12 月, DeepSeek-V3 发布,性能对齐海外领军闭源模型。据官方技术论文披露, V3 模型的总训练成本 为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 英伟达、亚马逊等已先后上线部署支持用户访问 DeepSeek-R1 模型。 2 月 1 日,华为云官方发布消息,硅基流动和华为 云团队联合首发并上线基于华为云昇腾云服务 的 DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE 实现高效的推理和低成本训练,构建 DualPipe 算法和混合精度训练优化计算与通信负载;通过 ( 分阶段 ) 强化学习实现 里 Qwen2.5-72B 、 Meta 的 Llama-3.1-405B 等其他开源 模型,并 逼近 GPT-4o 、 Claude-3.5-Sonnet 等顶尖闭源模型。据官方技术论文披露, V3 模型的总训练成本为 557.6 万美元,对比 GPT-4o 等模型的训练成本 约为 1 亿美元。 l 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。
    10 积分 | 38 页 | 1.95 MB | 10 月前
    3
  • ppt文档 DeepSeek华为云AI解决方案

    ( Console 平台)两 种方 式部署。 DeepSeek 模型 云服务 卡数 包月(元 / 月) R1 ModelArts Lite&Standard 32 卡起步 606480 V3 ModelArts Lite&Standard 32 卡起步 606480 场景 1 :基于 ModelArts Lite/Standard 部署 DeepSeek R1&V3 全尺寸模 型 虚拟机 寸模型 DeepSeek 模型 云服务 卡数 按需(元 / 小时) 包月(元 / 月) R1 ModelArts Studio 32 卡起步 1263.5 606480 V3 ModelArts Studio 32 卡起步 1263.5 606480 R1-Distill-32B ModelArts Studio 2 卡起步 68.7 / R1-Distill-14B
    10 积分 | 16 页 | 850.86 KB | 10 月前
    3
共 30 条
  • 1
  • 2
  • 3
前往
页
相关搜索词
电子行业电子行业深度报告DeepSeek推动模型平权关注AI终端及算力领域面向审计操作指南27WORD浙江大学浙江大学优势算力成本角度解读2025华为解决方案解决方案洞察应用人工智能人工智能技术发展实践山东东大山东大学部署消费新型最佳分享本地本地化通识教育未来系列专题重塑开源生态爆发持续推升需求
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 - 2026 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩