DeepSeek洞察与大模型应用-人工智能技术发展与应用实践,在数学和代码等需要深度推理的场景下明显胜出 n R1蒸馏版 vs. R1满血版:在数学、代码等场景下的性能有明显差距,蒸馏版参数量越小,与满血版差距越大 n R1蒸馏版 vs. V3满血版:140亿以上参数的R1蒸馏版的深度推理效果显著强于V3满血版;低参数量R1蒸馏版能力落后 于V3 模型 AIME 2024 MATH- 500 GPQA Diamond LiveCode rating R1的15亿蒸馏版 (基于千问) 28.9 83.9 33.8 16.9 954 R1的70亿蒸馏版 (基于千问) 55.5 92.8 49.1 37.6 1189 R1的140亿蒸馏版 (基于千问) 69.7 93.9 59.1 53.1 1481 R1的320亿蒸馏版 (基于千问) 72.6 94.3 62.1 57.2 1691 R1的80亿蒸馏版 DeepSeek-V3 39.2 90.2 59.1 36.2 1134 模型 架构 参数量 激活参数 R1的15亿蒸馏版 稠密 1.5B 1.5B R1的70亿蒸馏版 稠密 7B 7B R1的140亿蒸馏版 稠密 14B 14B R1的320亿蒸馏版 稠密 32B 32B R1的80亿蒸馏版 稠密 8B 8B R1的700亿的蒸馏版 稠密 70B 70B DeepSeek-R1 MoE10 积分 | 37 页 | 5.87 MB | 6 月前3
基于大模型的具身智能系统综述杂的任务, 单一具身智能体往往难以有效应对, 如 何设计有效的通信与协调框架, 使各具身智能机器 人之间高效沟通并综合各局部信息进行整合决策将 是一个具有极大前景的研究方向. 近期, AutoRT[140] 构造了一个自动化数据采集框架作为机器人协调 器, 可以自动地指定一个或多个机器人在环境中执 行适当的任务并收集真实数据, AutoRT 在多个建 筑物中对 20 多个机器人提出指令, 并收集了 models for large scale orchestration of robotic agents. arXiv preprint arX- iv: 2401.12963, 2024. 140 王文晟 中山大学计算机技术专业硕 士研究生. 2023 年获得北京科技大学 自动化学院测控技术与仪器专业学士 学位. 主要研究方向为基于大模型的 具身智能. E-mail: wangwsh23@mail220 积分 | 19 页 | 10.74 MB | 1 天前3
审计领域接入DeepSeek AI大模型构建Agent智能体提效设计方案(204页 WORD)..................................................................................................140 7.3.2 税务风险预警..................................................................................... 底稿自动生成模块支持按证监会各板块要求一键生成差异化的审计 报告;风险可视化模块通过动态知识图谱展示企业关联交易网络, 节点大小反映交易金额,边权重体现资金流转频率。 系统安全方面实施四重防护:FIPS 140-2 标准的传输加密、基 于 RBAC 的细粒度权限控制、审计操作区块链存证、模型推理结果 可解释性分析。性能优化上采用列式存储加速数据检索,热点查询 响应时间不超过 2 秒,支持年凭证处理量超10 积分 | 212 页 | 1.52 MB | 1 天前3
DeepSeek在金融银行的应用方案7.3 持续改进...........................................................................................140 8. 结论............................................................................................10 积分 | 154 页 | 527.57 KB | 6 月前3
DeepSeek智能体开发通用方案Taylor, S. Deep Learning Models for Agent Behavior Prediction[J]. Neural Networks, 2022, 145: 123- 140. DOI: 10.1016/j.neunet.2021.11.001. 8. 孙立, 王芳. 深度强化学习在智能体路径规划中的应用[J]. 机器 人, 2021, 43(4): 567-5790 积分 | 159 页 | 444.65 KB | 3 月前3
AI大模型人工智能数据训练考评系统建设方案(151页 WORD)12.3 系统交付.........................................................................................140 12.4 后续服务与支持..............................................................................143 1360 积分 | 158 页 | 395.23 KB | 4 月前3
智慧地铁城市轨道交通行业AI大模型应用设计方案..................................................................................................140 10.1 关键发现........................................................................................40 积分 | 154 页 | 284.34 KB | 5 月前3
AIGC生成式AI大模型医疗场景应用可行性研究报告(152页 WROD).....138 9.1 技术进步的可能性............................................................................140 9.2 市场趋势分析....................................................................................14260 积分 | 159 页 | 212.70 KB | 4 月前3
铁路沿线实景三维AI大模型应用方案138 8.1 日常运营管理....................................................................................140 8.1.1 系统运行监控...........................................................................142 8.1.240 积分 | 200 页 | 456.56 KB | 5 月前3
共 9 条
- 1
