DeepSeek消费电子行业大模型新型应用最佳实践分享R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B R1-Distill-Qwen-1.5B DeepSeek 部署方案 DeepSeek 全系大语言模型支持服务部署 并行解码 模型量化 并行优化 Sampling 及 batch 优 化 CPU 及 传 统 GPU 算 R1-Distill-Qwen-32B R1-Distill-Qwen-14B R1-Distill-Llama-8B R1-Distill-Qwen-7B R1-Distill-Qwen-1.5B DeepSeek 精调方案 DeepSeek 全系大语言模型支持 SFT • 全流程训推工具链,注重实战灵活性、扩展性 • 内置 Angel 加速能力,切实提升训推效率 •10 积分 | 28 页 | 5.00 MB | 6 月前3
审计领域接入DeepSeek AI大模型构建Agent智能体提效设计方案(204页 WORD)型可预测下一季度应收账款周转率偏离阈值概率,输出如下关 键指标: 预测指标 基准值 波动区间 风险概率 建议审计频率 存货周转率 5.2 ±0.8 68% 季度专项审计 销售费用占比 12% +1.5%/- 0.7% 82% 月度抽样检查 关联交易金额占比 8% ±2% 45% 年度常规审计 2. 决策树驱动的应对方案生成 当检测到关键指标异常时,系统自动触发决策逻辑树,输出可 操作 千万级关系数据查询<1 秒 GraphQL 工作流自动化 Camunda+Docx4j 并发流程实例>100 个 XML Schema 智能问答 BERT+FAISS 索引 问答响应时间<1.5 秒 WebSocket 开发阶段需特别注意三个技术要点:第一,审计数据的敏感性 要求所有模块必须实现数据传输加密和静态数据脱敏;第二,会计 政策变更等业务变化需通过配置化方式应对,避免硬编码;第三, 1. 线上推理时记录模型不确定案例(置信度<85%) 2. 审计专家每周复核 10%的边界案例并标注 3. 每月执行增量训练,更新版本需通过: - 测试集准确率提升≥2% - 误报率下降≥1.5% - 推理速度波动<5% 性能监控指标包括: - 关键字段识别准确率(目标≥92%) - 多表关联分析耗时(目标<3 秒/百万行) - 规则冲突检出率(目标覆盖 95%以上) 版本控制10 积分 | 212 页 | 1.52 MB | 2 天前3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)(Chain of Thought, CoT) QwQ 由通义千问 开发, QwQ 能通 过思考与疑问解 决 一些复杂的问 题。 HIMl DeepSeek-R1 与 Kimi1.5 都采用 RL 来 进 行推理能力的增强 Gemini 2.0 Flash Thinking 经过训 练后,可以生成模 型在回答问题时 经历的思考过程。 推理大模型 :通过测试时拓展( 大宗商品交易行情 15 亿 + 政策 590 万 + 资讯 4000 万 + 招投标 14 亿 + 论文 1.2 亿 + 书籍 291 万 百科 410 万 数据描述 数量 专利 1.5 亿 + 数据描述 数量 企业库 1.9 亿 + 数据描述 数量 行业舆情 1.3 亿 + 数据来源: 数据来源: 数据来源: 海量数据资源 风险信息 200 万 + 通用产业数据20 积分 | 61 页 | 13.10 MB | 2 天前3
DeepSeek洞察与大模型应用-人工智能技术发展与应用实践79.8 97.3 71.5 65.9 2029 DeepSeek-V3 39.2 90.2 59.1 36.2 1134 模型 架构 参数量 激活参数 R1的15亿蒸馏版 稠密 1.5B 1.5B R1的70亿蒸馏版 稠密 7B 7B R1的140亿蒸馏版 稠密 14B 14B R1的320亿蒸馏版 稠密 32B 32B R1的80亿蒸馏版 稠密 8B 8B R1的700亿的蒸馏版10 积分 | 37 页 | 5.87 MB | 6 月前3
信息服务-AI Agent(智能体):从技术概念到场景落地消耗价目表 资料来源:OpenAI,海通证券研究所 在实际测试中,使用搭载 GPT4 的智能体模型查找新闻并进行总结梳理。这部分的 单次消耗是 42000 个 tokens,成本是 1.5 美元。在实际应用中,假设一天需要统计的股 票新闻大约有 120 家公司,则成本为 35.8 美元,按照汇率 1 : 7.14 折合人民币 255.5 元。而且智能体并不是完美的,在运行过程中出现幻觉或错误循环也是常事。例如智能 写作或打造一个文字冒险游戏等。用户不仅可以与单个智能体进行交流,还可以创建包 含多智能体的群聊,这些智能体可以互相交谈且用户也能参与其中。 2023 年 3 月,Character.AI 完成了一笔 1.5 亿美元的融资,估值达到 10 亿美元, 由 a16z 领投。公司的创始人 Noam Shazeer 曾是谷歌首席软件工程师,也是 Transformer 论文的作者之一。公司将这笔融资用于拓展模型的计算能力并提高其回答10 积分 | 33 页 | 4.71 MB | 2 天前3
AI知识库数据处理及AI大模型训练设计方案(204页 WORD))为标准差。通过设定阈值(如 Z-score 的绝 对值大于 3),可以将超出该范围的数据点视为异常值。另一种方 法是基于箱线图(Boxplot),通过四分位数范围(IQR)来识别 异常值,即超出 1.5 倍 IQR 的数据点被视为异常值。 对于数据集中的异常值,处理方式通常包括以下几种: - 删除 异常值:如果异常值是由于明显的错误(如数据录入错误)而产生 的,且数量较少,可以直接删除这些异常值。 力,通过数据并行或模型并行的方式加速训练过程。 以下是模型压缩与加速技术的性能对比表: 技术 压缩率 速度提升 性能损失 剪枝 2-10x 1.5-3x 0.5-2% 量化 4-8x 2-4x 1-3% 知识蒸馏 2-5x 1.5-2x 1-2% 轻量级架 构 3-6x 2-3x 0.5-1.5% 在实际应用中,通常需要根据具体的场景和需求,结合多种技 术来达到最佳的压缩与加速效果。例如,可以先通过剪枝和量化来60 积分 | 220 页 | 760.93 KB | 4 月前3
基于大模型的具身智能系统综述在此之 后, 具有优秀泛化能力与丰富常识的基础模型在计 算机视觉、自然语言处理等领域都展现出令人瞩目 的效果. GPT-4[5]、LLaMA[6]、LLaMA2[7]、Gemini[8]、 Gemini1.5[9] 等大语言模型能与人类进行流畅的对 话, 进行推理任务, 甚至进行诗歌和故事的创作; BLIP (Bootstrapping language-image pre-train- ing)[10 2312.11805, 2024. 8 Georgiev P, Lei V I, Burnell R, Bai L B, Gulati A, Tanzer G, et al. Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context. arXiv preprint arXiv: 240320 积分 | 19 页 | 10.74 MB | 2 天前3
算力与场景双驱动,智能软件研发进入“平台 服务”融合新阶段 头豹词条报告系列15.2 同比增长(%) 39.6 毛利率(%) 总市值 - 营收规模 12.7亿元 26.5 同比增长(%) 53.8 毛利率(%) 总市值 - 营收规模 74.3亿元 1.5 同比增长(%) 25.8 毛利率(%) 总市值 427.6亿 营收规模 25.7亿 16.8 同比增长(%) 毛利率(%) - 总市值 - 营收规模 13.5亿元 13.310 积分 | 18 页 | 5.48 MB | 3 月前3
智慧地铁城市轨道交通行业AI大模型应用设计方案的值被认为是异常值。该方法适用于正态分布的数据集。 2. IQR 方法:计算数据集的四分位数(Q1 和 Q3 ),并通过 IQR(Q3 - Q1 )来判断异常值。通常情况下,位于 Q1 - 1.5 * IQR 和 Q3 + 1.5 * IQR 之外的点被视为异常值,这种方法对 于偏态分布的数据较为稳健。 3. 基于模型的方法:可以利用机器学习模型,如孤立森林 (Isolation Forest)和局部离群因子(LOF)等,自动识别40 积分 | 154 页 | 284.34 KB | 5 月前3
Deepseek大模型在银行系统的部署方案设计σ=3 异常值数量 标准化 Z-score 标准化 均值=0, 方差=1 标准化后数据 数据增强 时间窗口滑动 窗口大小:5 增强后数据量 数据划分 分层抽样 训练:验证:测试 =7:1.5:1.5 各数据集大小 通过以上详细的数据处理步骤,可以确保 Deepseek 大模型在 银行系统中的高效部署和稳定运行。 4.4 数据安全 在 Deepseek 大模型部署于银行系统的过程中,数据安全是至10 积分 | 181 页 | 526.32 KB | 6 月前3
共 12 条
- 1
- 2
