DeepSeek消费电子行业大模型新型应用最佳实践分享

语言	格式	评分
中文（简体）	.pptx	3
概览
DeepSeek 消费电子行业大模型新型应用最佳实践分享陈树荣腾讯云智能商业化 2025.03 LEVEL 1 研发模型结构 LEVEL 2 研发预训练模型 LEVEL 3 基于模型 SFT LEVEL 4 直接调用大模型产业生态图大模型产业链上的生态，根据大模型生态上不同企业的定位，分成了四个等级的企业： • 自研大模型结构的企业 • 不用训练，直接调用大模型 API 的企业 • 研发预训练模型的企业 • 基于自己数据 SFT 做自己模型的企业 • 基于开源或者基于国内预训练模型结合自己数据进行微调的企业 …… …… …… …… 国外头部国内大厂国内创业明星国内外大模型百花齐放全球开源社区 DeepSeek 是“深度求索 ” 开发的一系列人工智能模型。 DeepSeek 通过持续的技术创新和市场拓展，在自然语言处理和大型语言模型方面取得了显著进展，在国际市场上获得了广泛认可。其中： ● DeepSeek-V3 是在 14.8 万亿高质量 token 上完成预训练的一个强大的混合专家 (MoE) 语言模型，拥有 6710 亿参数（激活参数 370 亿）。作为通用大语言模型，其在在知识类任务（知识问答、内容生成等）领域表现出色。 ● DeepSeek-R1 是基于 DeepSeek-V3-Base 训练生成的强化推理能力模型，在数学、代码生成和逻辑推断等复杂推理任务上表现优异。 DeepSeek 推动国产模型达到新的高度开源模型比肩头部闭源 60%+ 指标优于 Llama3.1 Claude-3.5 GPT- 4o 打破大模型技术壁垒重挫美国科技公司股价，英伟达市值下跌 5900 亿更高效资源利用使用 ~2,000 GPUs, 竞品使用 10,000+ GPUs 人工智能的 Sputnik 时刻被美国及其盟友列入各种限制更低的研发成本 * $5.6M vs. OpenAI’s $100M+ 投资浪费业务系统 A 对外出入口 A 应用逻辑 A 算法算力适应性差业务系统 B 对外出入口 B 应用逻辑 B 算法算力项目周期长业务系统 C 对外出入口 C 应用逻辑 C 算法算力统一出入口应用模板（ A/B/C… ) 算法池（ A/B/C… ) 算力池大模型时代企业 AI 项目“烟囱式 ”建设痛点越发严重智能化趋势下：多品牌多场景下的重复造车轮，导致模型算法和镜像等 AI 资产管理分散，无法沉淀复用和统一运用。底层统一上层统一中层异构 AI 治理集约敏捷的 AI 中台式建设业务系统 B 业务系统 C 业务系统 A AI 项目的烟囱式建设知识引擎大模型 API （ DeepSeek/ 客户专属模型 / 混元 / 行业模型等）模型 API 行业大模型客户专属模型模型 API 兼容 OpenAI 接口规范复刻 Deep seel 的推理加速能力一键发起模型部署推理加速 DeepSeek 模型客户数据训练加速 DeepSeek 联网助手文档问答知识摘要 • 模型 + 训练平台 + 应用构建平台全链路能力。 • 提供从训练——推理——应用的一站式丝滑服务体验 • 全面接入 deepseek 模型大模型工具链支持大模型研发至应用全栈技术算力计算集群（ H20/A10 等）国产算力适配高性能计算网络架构客户业务系统知识引擎应用数智人智能客服多轮改写文档解析向量检索文档拆分意图识别 RAG 知识文档知识问答开放对接知识引擎配置项工作流联网搜索模型部署服务管理应用场景大模型广场大模型精调解决方案腾讯云精调知识大模型 DeepSeek 系列模型 DeepSeek 系列模型一键发起模型训练模型训练内置 DS 全系模型客户专属模型客户专属模型混元系列模型混元系列模型 TI 平台模型服务腾讯云 TI 平台大模型模型训练和推理开发平台，灵活精调和部署私有 DeepSeek 训练部署应用数据中心分布式推理：解决大参数量模型部署，提供超长上下文窗口内置推理加速：全新升级 Angel 推理加速能力，加速比可达 2 倍大模型调用：统一的大模型调用 API 及体验工具，大幅缩短业务接入大模型能力周期 u 公有云自带容器底座 TKE u 私有化自带容器底座 TCS 腾讯云 TI 平台产品核心能力面向实战的一站式大模型精调部署解决方案 AI 建模部署大模型精调 u 快速试一试：零代码一键部署大模型，网页问答体验推理效果 u 精调训练：低代码、灵活自定义两种精调模式自由选择多种训练工具：具备周期调度能力的可视化建模，低门槛深度学习场景化工具，交互式代码开发工具，专业的通用任务调度工具分布式稳定训练：支持多机多卡大规模训练，故障自动重启续训镜像制作：基于 jupyter 的高效自定义镜像制作工具训练指标监控：丰富的指标监控及告警，覆盖网络及 GPU 算力内置训练加速：全新升级 Angel 训练框架加速能力，性能提升 30% 精调数据配比训练：内置 100+ 任务类型精调配比数据 AI 框架 u Pyspark ， pytorch, vllm ， megatron 等通用训练框架 u triton, vllm, sg lang, sd, pmml 等通用推理框架分布式文件存储 u 公有云分布式文件存储 CFS/Turbofs/Goosefsx u 私有化 NFS 协议存储 NAS/CSP 云服务器 u 公有云 HCC 高性能服务器，一键纳管 u 私有化服务器，支持 X86+ARM 统一纳管自研行业大模型 u 金融 / 汽车 / 医疗，提升垂类任务性能 u 支持知识增强、实时更新知识库开源大模型 u Deep seek 全系 u Llama/baichuan/chatglm/Qwen 等自研混元大模型 u 从零训练自主创新的通用大模型 u 7b 13b 70b 不同参数量级数据构建预置 3 大类精调数据处理 pipeline 数据标注 CV ，大模型相关的标注工具模型部署训练工坊数据调试容器底座 AI 资产管理资源管理一体化服务管理工具及推理加速能力一体化服务管理工具 Angel 推理加速指标监控鉴权 / 限流流量分配实时掌握服务性能、调用量、资源消耗等关键指标自动调度符算力资源，弹性灵活应对业务峰谷 HPA 扩缩容定时扩缩容组合扩缩容提供多种扩缩容策略，满足不同场景的灵活资源需求纳管资源组按量计费算力池大模型专属 GPU 算力包月独享核心收益长上下文 (64~128K) 超大模型启动加速独享 GPU 算力集群私有 API 服务调用高并发、高可用企业级鉴权流控算力投入持续降低 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B R1-Distill-Qwen-1.5B DeepSeek 部署方案 DeepSeek 全系大语言模型支持服务部署并行解码模型量化并行优化 Sampling 及 batch 优化 CPU 及传统 GPU 算力按需按量服务管理与运营算力调度容器调度核心收益满血版模型一键精调 • 256 卡 H20 • 全参 SFT • 8 小时蒸馏后模型多模式精调 • 全参 +LoRA 双模式 • 低至 1 卡 A10 DeepSeek 全系列 R1 、 V3 满血版 R1-Distill-Llama-70B R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B R1-Distill-Qwen-1.5B DeepSeek 精调方案 DeepSeek 全系大语言模型支持 SFT • 全流程训推工具链，注重实战灵活性、扩展性 • 内置 Angel 加速能力，切实提升训推效率 • 训练过程白盒化、资源碎片监控、训练资源调度灵活可配，切实提升资源利用率注重灵活性、扩展性的生产级大模型精调工具链 DeepSeek 蒸馏方案 DeepSeek 全系大语言模型支持 SFT 快速直观 R1 推理结果生成 R1 推理服务调用构造蒸馏数据集清洗 R1 推理结果灵活、易扩展基于 TI 平台精调工具链，迁移 R1 高级推理能力至小尺寸模型，以更低推理成本满足垂直场景下的业务需求内置 R1 模型一键部署快速选择并精调目标模型评估对比模型效果 R1 模型部署效果评估蒸馏模型任务式建模数据构建模型评测数据构建数据构建无关数据过滤剔除 R1 问题清洗在线服务 - - ~ TI 平台的 DeepSeek 实践全行业适用、让 DeepSeek 更好用 TI 平台 × DeepSeek 面向实战的精调部署平台全周期均可切入使用痛点不知道怎么基于 R1 蒸馏模型开源框架繁多，不知道怎么选 TI 平台价值内置蒸馏方案，开箱即用内置全系模型，一键精调多验证成本高算力投入大，优化成本长期存在配置自主可控，快速验证并发用量统一资源纳管，灵活切换启动阶段痛点一键多副本，快速线性扩缩容持续升级推理加速，降本增效故障多，无法长时间稳定运行规模扩大，人 / 物料管理难度高开源资源分散，准备周期长解决技术问题，体验效果滞后工具链易上手，快速验证效果统一资源纳管，灵活腾挪算力故障感知修复 + 监控，高可用细致的资源级权限管控稳定期痛点稳定期痛点探索期痛点根据业务量探索资源用量机型差异大，选型难验证效果链路长，耗时久算力空闲情况多， ROI 低探索期 TI 平台价值内置全系模型，一键部署免费体验，快速验证效果服务部署蒸馏精调启动阶段业务量变化，服务调整难度大 TI 平台价值 TI 平台价值 TI 平台价值 TI 平台价值痛点腾讯云大模型知识引擎基于大模型应用开发平台，助力客户加速大模型应用落地（零代码）知识引擎应用开发平台：面向初级开发者 & 企业运营腾讯云全栈 AI 服务上线 DeepSeek 模型通过 DeepSeek API 和应用开发平台多级能力，满足用户各类需求 API 服务：面向资深开发者 & 企业开发者（满血版）目标客户和场景 : • 面向具有一定开发能力的企业 / 资深开发者，期望通过多款原子能力组建专属服务。 • 可结合文档解析、拆分、 embedding 、多轮改写等服务进行组装，定制企业专属 AI 业务。主要优势 : • API 服务更稳定、安全、易用；满足大批量使用，可以弹性扩容满足客户需求；支持购买专属并发； • 限时免费试用（ 2025 年 2 月 25 日 23:59:59 前）； • 兼容 openai 的 API 接口协议，可快速调用体验。腾讯云 DeepSeek API 服务调用——安全、高可用主要优势 : • 国内率先支持「 DeepSeek 满血版 + 私域知识管理 + 实时搜索」于一体 • 分钟级搭建大模型应用 • 集成私域知识库，让 AI 更专业，支持复杂图文混排文档解析 > 目标客户和场景 : • 面向具备简单开发能力的初级开发者、企业运营人员。 • 可通过模型选择、提示词模版、 RAG 配置能力等加速大模型应用构建，实现与自身业务系统的无缝对接。接入搜狗搜索增强 API ，一键开关，即可让 DeepSeek 实时获取互联网最新资讯，提升时效性和回答准确度腾讯云大模型应用开发平台“知识引擎” —— 免部署，分钟级搭建应用腾讯云大模型知识引擎：基于大模型的应用开发平台聚焦严谨场景，打造大语言模型应用开发平台 , 提供 LLM+RAG 、工作流、 Agent 多种应用开发方式，来助力企业及开发者，加速大模型应用落地。混元大模型 turbo large standard standard-256k 腾讯云行业大模型精调知识大模型 / 多模态大模型金融 / 教育 / 医学行业大模型腾讯内部产品合作数智人企点客服腾讯学堂乐享应用原子能力大模型文档解析 - 拆分 - 入库 - 检索向量化（ embedding ） ③Agent 模式调用插件 / 复杂工作流响应用户对话 ② 工作流模式指定工作流响应用户对话文档拆分重排序（ rerank) ① 官方插件文档解析 / 混元文生图 .. 汽车语音助手零售电子说明书金融代理人辅助 ... ① 标准模式内置 RAG 最优流程文档解析多轮改写文旅虚拟导游政务一网通办 ② 自定义插件应用场景三方大模型插件工作流模式 “ 智能生产线 ” 使用指定的工作流来响应用户所有对话。如果你对应用的执行流程，有更加个性化的需求，可以通过工作流，来拖拉拽各种原子能力，编排你想要的流程。标准模式 “RAG ：最强知识外挂 ” 平台内置最佳实践流程，只需导入文档 / 问答对，即可达到更稳定和精确的知识问答效果。适用于企业知识服务、产品咨询等严肃问答场景。 Agent 模式 “AI 指挥官 ” Agent 模式由大模型进行任务自主规划和工具调用（ function- call ），可实现高效应用搭建。适用于有灵活回复或快速搭建需求的服务问答场景。要稳定选标准模式，要定制选工作流，要尝鲜选 Agent ！腾讯云大模型知识引擎：三大应用模式，满足客户多样需求文件助手员工服务专家助手智能客服把企业五花八门的知识库喂给大模型，没那么简单！难点：企业知识格式多样、图文并茂复杂排版的阅读顺序复杂的子元素识别复杂的表格结构跨栏段落跨图段落少线表格无线表格有线表格段落内图像段落内公式表格内图像表格内公式跨表段落图表文环绕纵向多栏图 / 图注群组表 / 表注群组横向多栏传统 OCR 技术局限：识别精度低、元素易丢失高准确的复杂文档解析、切分能力基于 OCR 大模型，打造的解析引擎，突破图文混排版面分析、复杂表格识别等文档解析技术瓶颈，支持超过 20 类文档类型。业界首个支持 200MB 以上超大文档 vs. 业内普遍 100MB 内丰富的文档类型，超过 26 类 vs. 业内普遍 10 类以内支持图文混排（多列排版）版面分析、图文表 / 公式 / 页眉等元素识别识别精度高、图片元素不丢失大模型知识引擎 : 强大 RAG 能力加持，搭建精准的知识问答应用复杂文档解析、切分、检索、推理、生成准确率保持领先高准确的综合检索能力上线基于 LLM 的 embedding 模型，多文档信息召回率从 85% 提升到 92% ；混合检索 +Text2SQL 能力，提升超大表格单表检索及跨表检索准确率， SQL 执行准确率 80%+ Query “ 非智能且在售，并且一级分类是天棚灯的产品包含哪些 ” 通过 SQL 检索表格信息腾讯云 RAG+DeepSeek ：充分考虑文、图两种模态的检索优化、能力打磨腾讯云 RAG+DeepSeek ：图文并貌的产品操作说明说明书样例 “ 制动系统怎么保养？” 开发票、挂号、预约试驾、政务服务 ... 报销、 IT 报修、预订会议室 ... 满意度分析适合处理过程复杂且分支较多、对结果准确性要求高的业务场景员工服务自动化服务智能客服提供 10+ 画布节点，编排复杂应用，复杂流程的执行准确率和对话完成率效果领先。通过可视化拖拉拽的方式编排不同的原子能力，零代码 / 低代码构建业务流程。其中参数提取节点，支持多参数同时提取、基于对话历史进行多轮反问澄清等优势能力，对话效果更优势。大模型相关的节点均接入 DeepSeek R1 和 V3 模型，可支持自由选择和切换。大模型知识引擎“工作流” : 支持用户快速编排复杂应用面向复杂业务流程场景，升级复杂应用构建能力 2. 信息处理节点均已支持 DeepSeek 模型 1. 信息收集节点已支持 DeepsSeek 模型 3. 基础节点实用工具办公提效大模型知识引擎“ Agent 模式” ：自主规划和工具调用由大模型自主拆解任务和规划路径，模型主动选择和调用工具，并能够主动纠错和反思，回复效果更灵活。创造价值，赢在一起！