温室大棚物联网解决方案(28页 PPT)v3.010 积分 | 28 页 | 10.58 MB | 19 天前3
2025年DeepSeek赋能自智网络高阶演进评测报告������������������������������������������ 5 � � DeepSeek�V3 � R1 ������������������������ ������������������·���������AISWare�AN� Evo1��� DeepSeek�V3�R1 模���������� DeepSeek ����� �����务����������������������������� ���������������������� � 6-1 ���������� ����� 1 �������撰��������� 2 ���� DeepSeek R1�DeepSeek V3 ������������ 800 �模����������� 3 �研������������������������ 6.1.2 �������������� �� 6-1 ������������ 准 确 性 业 务 智 能 编 排 完 整 性 业 务 智 能 编 排 识 别 率 业 务 智 能 编 排 语 义 一 致 性 �������� DeepSeek R1 DeepSeek V3 模型C 模型D 模型E 95.00% 96.00% 91.20% 89.00% 89.00% 91.60% 93.00% 94.00% 94.40% 90.20% 90.20%10 积分 | 40 页 | 16.72 MB | 5 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域chenweiguang@dgzq.com.cn 电子行业指数走势 资料来源:东莞证券研究所,Wind 相关报告 投资要点: DeepSeek推动模型平权,关注AI终端及算力领域。2024年12月,DeepSeek V3 首 个 版 本 上 线 , 在 多 项 评 测 成 绩 超 越 了 Qwen2.5-72B 和 Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。 风险提示:终端需求不 ......14 图 27 :雷鸟创新 V3 拍摄眼镜 .......................................................... 15 图 28 :雷鸟创新 AI 下棋实时指导功能 .................................................. 15 图 29 :雷鸟创新 V3 支持边充边用 ............0 积分 | 23 页 | 2.65 MB | 6 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域chenweiguang@dgzq.com.cn 电子行业指数走势 资料来源:东莞证券研究所,Wind 相关报告 投资要点: DeepSeek推动模型平权,关注AI终端及算力领域。2024年12月,DeepSeek V3 首 个 版 本 上 线 , 在 多 项 评 测 成 绩 超 越 了 Qwen2.5-72B 和 Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。 风险提示:终端需求不 ......14 图 27 :雷鸟创新 V3 拍摄眼镜 .......................................................... 15 图 28 :雷鸟创新 AI 下棋实时指导功能 .................................................. 15 图 29 :雷鸟创新 V3 支持边充边用 ............10 积分 | 23 页 | 2.65 MB | 5 月前3
面向审计行业DeepSeek 大模型操作指南(27页 WORD)领域取得了显著成果,主要使用数据蒸馏技术,得到更为精炼、有用的数 据。 2024 年 1 月 5 日,发布 DeepSeek LLM(深度求索的第一个大模型), 目 前, DeepSeek-R1 、V3 、Coder 等系列模型已上线国家超算互联网平台。英伟 达称, DeepSeek-R1 是最先进的大语言模型,亚马逊和微软也接入 DeepSeek-R1 模型。 DeepSeek 大模型在 Sonnet ) 不相上下。 DeepSeek 被业界认为“ 以高性价比著称的 AI 模型服务商”,原因是这家公 司 的出现极大地降低了大模型训练和应用的成本,如该公司开发的 DeepSeek- V3 训练成本仅 557.6 万美元,而 OpenAl 训练 GPT-4 所花费的成本高达 7800 万 美元 甚至是 1 亿美元,双方的成本相差至少 10 倍。DeepSeek-V3 在数学、代 码能力 即可。 图 1 DeepSeek 注册页面 登录成功后,进入图 2 “ 所示界面,然后点击 开始对话 ”就可以使用。 图 2 DeepSeek 官方网站主界面 不过需要注意,那就是如何选择 V3 还是 R1 模型,可以参考下图。此外还 “ 可根据需要,选择是否勾选 联网搜索 ”。 图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用 手机版的使用和电脑版基本一样,根据需要是否激活0 积分 | 27 页 | 829.29 KB | 20 小时前3
浙江大学-DeepSeek模型优势:算力、成本角度解读20252*107 DeepSeek v3 2024 年 12 月 2.8*106 5.6*106 DeepSeek V3 公开的单次极低预训练成 本 DeepSeek 全部训练单次成本: 5,576,000 美 元 单张 H800 GPU 每小时租赁成本: 2 美 元 泛大 模型 / 指标 DeepSeek V1 DeepSeek V2 DeepSeek V3 Llama 3.1 0 OO00 1 ■ DeepSeek V3 模 型 参 数 ? 671B 参数 (GPT-3:175B 、 GPT-4:1.76T?) ■ 每个 token 激 活 3 7B 参数 (~5.5%), 降低计算 量 MoE: 1 共享专家 + 256 路由专家 MLA: 低秩压缩 DeepSeek v3 模型参 数 L=61 层 oo oouatence9 ■ 以中国的工业化水平,站着把 Al 的钱给挣了。 ■ “健身可以让 SB 跟你好好说话”→ ■“ 突破模型、算力卡脖子可以让 A 国跟咋们好好说话” DeepSeek V3 未来 展望10 积分 | 23 页 | 7.53 MB | 5 月前3
华为昇腾DeepSeek解决方案蒸馏技术使能第三方模型性能 DeepSeek V3 :实现极致性能,稀疏 MOE 提质 降本 技术创新 硬件级、算法级、架构级、工程级、开 源生态 5 大技术创新,轰动全球 低成本 绕过 CUDA 挖掘 FP8 硬件潜力, MOE 和 MLA 技术实现不到 10% 的 成本方案 ~150M$ 5.57M$ DeepSeek–V3 训 练成本 Llama3.1-405B 北京、南京、西安、武 汉、苏州、无锡等公共 服务平台 已上线 招行 测试中 工行 测试中 太保 测试中 模型名称 Atlas 300I Duo Atlas 800I A2 DeepSeek V3 - √ DeepSeek R1 - √ DeepSeek Janus-Pro-1B/7B √ √ DeepSeek R1-Distill-Llama-70B - √ DeepSeek R1-Distill-Qwen-32B DeepSeek-R1-Distill-Llama-8B DeepSeek-R1-Distill-Qwen-7B 模型参数: 671B+ 满血版 DeepSeek V3/R1 模型参数: 70B DeepSeek-R1-Distill-Llama-70B AI 编程 智能对话 金融研报 文本创作 营销文案 内容检测 Atlas 800I A2 (1024GB)0 积分 | 32 页 | 2.52 MB | 5 月前3
DeepSeek洞察与大模型应用-人工智能技术发展与应用实践DeepSeek不同版本对比 n V3 vs. R1:R1在普通的中文和英文任务上性能小幅领先,在数学和代码等需要深度推理的场景下明显胜出 n R1蒸馏版 vs. R1满血版:在数学、代码等场景下的性能有明显差距,蒸馏版参数量越小,与满血版差距越大 n R1蒸馏版 vs. V3满血版:140亿以上参数的R1蒸馏版的深度推理效果显著强于V3满血版;低参数量R1蒸馏版能力落后 于V3 模型 AIME 2024 a。DeepSeek R1相当于是像 2023年初的OpenAI ChatGPT一样,让所有人真正地感受到了震撼” V3训练开销&R1效果引发全球热议 ChatGPT Llama o1/o3 DeepSeek-R1 首次提出 开源复现 ★ DeepSeek V3效果对标顶级闭源模型,训练成本比LLaMA低一个量级 30.8 2.8 0 20 40 Llama 3.1 AI工具 1、多模态、语音、视觉模型联动 2、挂RAG知识库、联网搜索优化等 3、接入智能体平台 ….. B端生产场景多数重复使用模型某一重复能力, 大量百亿级参数模型即可适用 • DS -V3/R1满血版推理需16-32张910B,LORA微 调需512张910B。大量客户无支持微调的算力。单 任务算力消耗与百亿级参数模型不在同一量级 • DS 最惊艳的R1版,一次推理多在10-20秒,更适合10 积分 | 37 页 | 5.87 MB | 5 月前3
山东大学:DeepSeek 应用与部署2023 — DeepSeek : 技术创新——模型架构 | V2 ( Multi-Head Latent Attention ) DeepSeek : 技术创新—模型架构 | V3 PPO : Proximal Policy Optimization GRPO : Group Relative Policy Optimization 强化学习让智能体( Agent )在环境 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - 1.5B 等 , 部分限时免费 ,涵盖文本生成等功能。 • 百度智能云: 千帆 Model Builder 全面支持 DeepSeek - R1/V3 调用 ,且限时免费 ,其模型在百科知 识、 数学推理等任务表现突出。 • Distill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-7B DeepSeek DeepSeek-R1 - Ditill-Qwen- 1.5B DeepSeek- V3 DeepSeek- R1 腾讯云部署流程 • Cloud Studio :登录腾讯云官网 ,进入 Cloud Studio ,可一键部署 ,即开即用 ,能快速体验 7B 以下10 积分 | 79 页 | 6.52 MB | 5 月前3
数字化仓储项目应用方案(30页 WORD)WMS,视作完 成上架作业,如不相符,则发出声音警示和错误状态提示,以便作业人员 核对后重新正确上架(紫色)。 5. 上架作业完成后,“入库任务单”和“入库单”完成,更新 WMS 数据,并向 V3 系统传送入库数据(橙色)。 3.托盘调整 1. 拆盘时,作业人员用手持 RFID 读写终端读取移出托盘电子标签相关信息, 读取移出货物的条码,并将信息反馈予 WMS,解除原有货物/托盘关联; WMS,WMS 实时更新库存 信息,并将更新后的库存数据发送予 V3 系统(红色、绿色)。 5.移库调度 1. 货主在其 V3 系统中录入“移库申请单”,并发送至东部物流 WMS。 2. WMS 对“移库申请单”进行处理,产生以承运车辆为单位的 “干线物流任务 单”,以此为依据申领准运证,然后以货主为单位生成“移库出库单”,并反 馈回 V3 系统。 6.出库调度 WMS 将“干线物流任务单” 验,发现不相符时即时发出警报,由作业人员重新校核调整。同时实时统计移 库货物信息,并将移库货物信息反馈回 WMS 进行移库确认。 装车完成后,WMS 更新“移库出库单”状态为完成,更新库存信息,并将相 关信息发送予 V3 系统。 11.分拣出库交接 1. 智能调度系统把零售客户订单信息(包括品规、数量、线路、顺序等)导 入 WMS,生成分拣出库单。(蓝色) 2. WMS 从分拣系统中导入分拣进程状态,按循环补货的策略和出库货位分配0 积分 | 36 页 | 2.06 MB | 19 天前3
共 79 条
- 1
- 2
- 3
- 4
- 5
- 6
- 8
