DeepSeek洞察与大模型应用-人工智能技术发展与应用实践MTP多token预测(提升效果、提升推理速度) • FP8混合精度训练、DualPipe流水线、MoE负载 均衡(提升训练效率,降低训练成本) DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和 世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 DeepSeek-V3 -4- • R1推出后,追平GPT-o1,迅速出圈海外。从 DeepSeek-V3 MMLU 得分 API价格¥/M tokens 90 82 86 ★ l Llama3.1-405B l GPT-4o l Qwen2.5-72B l Qwen2.5-72B l Claude 3.5 Sonnet l DeepSeek-2.5 l GPT-4o mini 模型性能/价格比最优区间 (对数坐标)100 10 -9- Deep DeepSeek-V3, #9 Deepseek-v2.5-1210, #17 开放 阿里巴巴 中国 Qwen2.5-Max, #7 Qwen2.5-plus-1127, #16 Qwen2.5-72B-Instruct, #33 不开放 不开放 开放 智谱 中国 GLM-4-Plus-0111, #9 不开放 阶跃星辰 中国 Step-2-16K-Exp, #9 不开放 xAI 美国 Grok-2-08-1310 积分 | 37 页 | 5.87 MB | 6 月前3
审计领域接入DeepSeek AI大模型构建Agent智能体提效设计方案(204页 WORD)是在区块链、云计算等新技术应用场景中,传统审计方法难以实现 交易链路的全流程穿透。 以下数据直观反映了审计效能瓶颈的关键指标: 指标维度 行业平均值 监管期望值 差距率 异常交易识别时效 72 小时 ≤24 小时 200% 全量数据分析覆盖率 12% ≥90% 650% 审计调整事项回溯准确 率 68% ≥95% 40% 为突破这些限制,领先机构已开始探索智能审计路径。德勤 2024 首先是自动化数据采集与清洗,通过智能体对接财务系统、银行对 账单和税务平台,实现多源异构数据的实时归集与标准化处理,解 决传统审计中数据孤岛问题。某试点项目数据显示,采用智能体 后,数据准备周期从平均 72 小时缩短至 4 小时以内。其次是风险 识别与异常检测,基于深度学习模型分析历史审计案例和行业风险 特征,智能体可自动标记异常交易模式,其检测准确率在测试环境 中达到 92%,远超人工抽样检查的 连锁效应因子(1.2-1.8 倍) 3. 动态等级划分机制 设置五级风险标签,根据企业风险偏好动态调整阈值区间: o 紧急(红色):分值≥85,需 24 小时内响应 o 高危(橙色):70-84,72 小时响应 o 中危(黄色):50-69,周报跟踪 o 关注(蓝色):30-49,月度审计覆盖 o 正常(绿色):<30,常规监控 4. 智能报告生成流程 报告内容通过模块化模板自动组装,包含三个核心部分:10 积分 | 212 页 | 1.52 MB | 2 天前3
基于大模型的具身智能系统综述OLAF[80], YAY Robot[81], Socratic Models[82], MUTEX[83], ORION[84], MOKA[85], ViLA[30] Text2Motion[72], PaLM-E[73], SayCan[74], EmbodiedGPT[75], ELLM[76], Voyager[77], LLM-Planner[78], KnowNo[79] ViLA[30] 的代表性贡献的工作. 2.1 需求级 需求级负责理解用户需求, 利用大模型的强大 理解能力准确分析用户需求中隐含的任务要求, 并 分解为机器人可以完成的具体任务. Text2Motion[72] 构造了一个将自然语言指令转 换为一套既符合需求也满足物理执行条件的框架, 框架使用大语言模型进行高层次任务规划, 从多种 机器人技能组成的技能库中选择合适的技能, 并使 用几何可行性规划器优化技能序列参数 From natural language instructions to feasible plans. Autonom- ous Robots, 2023, 47(8): 1345−1365 72 Driess D, Xia F, Sajjadi M S M, Lynch C, Chowdhery A, Ichter B, et al. PaLM-E: An20 积分 | 19 页 | 10.74 MB | 2 天前3
Deepseek大模型在银行系统的部署方案设计...................................................................................................72 8.1 性能基准......................................................................................... 低优先级:对业务影响较小或仅涉及非关键 功能的问题,需要在 72 小时内响应并解决。 以下是一个优先级评估的示例表格: 问题类型 影响范围 紧急程度 优先级 响应时间 解决时间 系统全面中断 所有用户 非常高 高 2 小时内 4 小时内 部分功能失效 部分用户 高 中 24 小时内 48 小时内 性能下降 特定业务模块 中 中 24 小时内 72 小时内 数据同步延迟 后台系统 低 低 72 小时内 120 小时 内 性能测试方面,我们对系统的响应时间、并发处理能力以及系 统稳定性进行了评估。测试结果表明,系统在高峰期能够处理超过 1000 个并发请求,平均响应时间低于 2 秒,完全符合银行的业务 需求。此外,系统在连续 72 小时的负载测试中未出现任何崩溃或 性能下降的情况,证明了其极高的稳定性。 安全性测试是验收过程中的重点之一。我们对系统的数据加 密、用户身份验证、访问控制以及日志记录等功能进行了详细检 查10 积分 | 181 页 | 526.32 KB | 6 月前3
从DeepSeek探讨大语言模型在建筑及能源行业的应用趋势和技术方法体。如果我们能改变这种状况,由此释放出 的创造力,将为我们所有人带来巨大的福祉。 Op enAl 宣告 通用人工智能 (AGI) 时代临近 (2025 年 2 月 10 日 ) 72/80 ● 随着通用人工智能变得更有能力,额外风险的证据正在逐渐出现。这些风险包括大 规模劳动力市场影响、人工智能黑客攻击或生物攻击,以及社会失去对通用人工智 能的控制。专家们10 积分 | 78 页 | 33.88 MB | 6 月前3
2025年以计算加速迈进智能化未来-IDC新一代云基础设施实践报告处理市场情绪分析、行情预测、风险评估、自动化客服等关键金融任务,保证任务处理时间在时 延阈值范围内。在这个过程中,ECS g�i 在模型推理加速方面提升了 2.3 倍,推理消耗时长降低 了 35%,算力成本降低了 72%。 PaaS 层:Zoloz 的智能体平台支持金融客户搭建智能体应用,构建企业级智能知识库平台⸺ RAG。在文档提取洞察、智能合规审计等场景中,实测智能体表现优异,任务平均处理时间大幅 降低。搭载至强10 积分 | 27 页 | 5.31 MB | 3 月前3
AI知识库数据处理及AI大模型训练设计方案(204页 WORD)Windows、Linux、macOS)及浏览器(如 Chrome、Firefox、Safari)环境下,系统应能正常运行,且界面 布局、功能按钮等元素应保持一致。同时,系统应能够持续稳定运 行至少 72 小时,不发生崩溃或数据丢失现象。 第三,系统应具备完善的权限管理功能。不同角色的用户应能 够根据其权限访问相应的功能和数据。具体权限划分如下: 管理员:具有所有功能的访问和操作权限; 紧急问题:响应时间不超过 2 小 时,解决时间不超过 24 小时 - 重要问题:响应时间不超过 4 小 时,解决时间不超过 48 小时 - 一般问题:响应时间不超过 8 小 时,解决时间不超过 72 小时 为了确保技术支持团队的高效运作,应定期进行技术培训和知 识更新,使其能够熟练掌握最新的数据处理和模型训练技术。 最后,建立一个长期的技术演进路线图,规划未来 1-3 年内的 技术升级60 积分 | 220 页 | 760.93 KB | 4 月前3
大模型技术深度赋能保险行业白皮书151页(2024)· · · · · · · · · 71 4.5.2 治理措施· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 72 4.6 伦理与合规· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 73 4.6.1 安全风险· · · PT-4模型在自然语言处理任务中表现出 色,但其模型细节和训练数据并未完全公开,限制了其他研究人员对其进行进一步的研究 和优化。 开源模型:开源模型如Meta的LLaMA3和阿里的Qwen2-72B模型,为研究人员和开发 者提供了丰富的资源。通过开放访问和使用,研究人员可以更容易地掌握先进的模型架构 和训练方法,为研究人员和开发者提供了一个共同的平台,以拓展人工智能技术的能力边 界,并20 积分 | 151 页 | 15.03 MB | 2 天前3
基于AI大模型Agent智能体商务应用服务设计方案(141页 WROD)...................................................................................................72 9.1 性能指标与测试......................................................................................10 积分 | 141 页 | 647.35 KB | 2 天前3
DeepSeek智能体开发通用方案续的修复和优化提供依据。 以下为验收测试的关键指标示例: 功能测试通过率:95%以上 性能测试响应时间:平均不超过 2 秒 安全性测试漏洞发现率:无高危漏洞 稳定性测试无故障运行时间:连续运行 72 小时无异常 兼容性测试通过率:100% 通过上述系统化的验收测试,可以全面评估 DeepSeek 智能体 的开发成果,确保其在实际应用中的可靠性、安全性及性能表现, 为项目的最终交付提供有力保障。0 积分 | 159 页 | 444.65 KB | 3 月前3
共 16 条
- 1
- 2
