推理模型 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

DeepSeek大模型及其企业应用实践

先显式地写出推理的中间步骤。这就像人类解决复杂问题时会先把思考过程写下来一样。 OpenAI定义推理模型也就是说，如果模型在回复你之前有一长串的思考过程（这个过程必须可以显示输出），探索了很多不同的路径之后给出答案，那么有这个能力的大模型就是推理大模型。推理模型的核心在于处理那些需要多步骤逻辑推导才能解决的复杂问题。推理模型的核心 1.4 大模型的分类 n 推理大模型DeepSeek R1的对话效果推理问题： ”一列火车以每小时60英里的速度行驶3小时，行驶距离是多少？” （需先理解”距离=速度×时间”的关系，再分步计算）通用的大语言模型（LLM）可能直接输出简短答案（如”180英里”）推理模型的特点在于显式展示中间推导过程 1.4 大模型的分类在应用方面二者各有擅长的领域，而不是简单的谁强谁弱问题 n 如果你需要完成数据分析、逻辑推理、代码生成等逻辑性较强且较为复杂的任务，请选择推理大模型灯红酒绿的霓虹灯，热闹非凡的唐人街正在进行舞龙表演，熙熙攘攘的人群目光都聚焦在跃动的彩龙身上，整个环境的喜庆氛围仿佛令人身临其境 2.1 国外的大模型产品 n OpenAI o3 2024年12月20日，OpenAI发布推理模型o3，无论在软件工程、编写代码，还是竞赛数学、掌握人类博士级别的自然科学知识能力方面，o3都达到了很高的水平 2.2 国内的大模型产品大模型图标指标排名 DeepSeek 能力测评第一

10 积分 | 147 页 | 16.82 MB | 1 年前
3
电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

Gemini 2.0 家族，包括 Gemini 2.0 Pro 实验版本、Gemini 2.0 Flash、 Gemini 2.0 Flash-Lite，并且还在 Gemini App 中推出了其推理模型 Gemini 2.0 Flash Thinking，在数据、代码等领域上较前代版本进一步提升。价格方面，o3 mini API 定价为每百万 tokens 输入 0.55 美元（缓存命中）/1 家族大模型，包括 Grok 3、Grok 3 mini 以及推理模型 Grok 3 reasoning、Grok 3 mini reasoning。其中 Grok 3 在数学、科学、编程等领域的性能进一步提升，表现好于 Gemini 2 Pro、DeepSeek V3、Claude 3.5 Sonnet 及 GPT-4o 等模型；而推理模型 Grok 3 reasoning Beta 在数学、科学、编程等表现上

10 积分 | 23 页 | 2.65 MB | 1 年前
3
DeepSeek如何加速金融业数字化转型？

SAC 编 ÷:S1440524080005 本报告的核心逻辑如何理解 DeepSeek 的出现对于国内金融业数字化转型的价值与意义 ? 一、低成本、高性能。 DeepSeek 通用及推理模型在性能不输头部同类大模型的基础上，成本相较于头部大模型下降至数十分之一以下，同时开源、本地化部署特性和蒸馏技术使金融机构无需重资本投入底层模型研发，降低试错成本和二次开发难度，对创新更加友好。数字化价值进行深入探讨，以期对金融行业的智能化和数字化转型提供参考。内容摘要如何理解 DeepSeek 的出现对于国内金融业数字化转型的价值与意义 ? 一、低成本、高性能。 DeepSeek 通用及推理模型在性能不输头部同类大模型的基础上，成本相较于头部大模型下降至数十分之一以下，同时开源、本地化部署特性和蒸馏技术使金融机构无需重资本投入底层模型研发，降低试错成本和二次开发难度，对创新更加友好。 / 百万 tokens ，昂贵云服务 & 大规模 GPU 集群 ) 模型类别模型名称输入价格 ( 元 / 百万 tokens) 输出价格 ( 元 / 百万 tokens ) 推理模型 deepseek- r1 4 16 deepseek- r1-32B 1.5 6 gpt-o1 109.5 438 gpt-o3-mini 8.1 32.1 生成模型

10 积分 | 77 页 | 16.76 MB | 1 年前
3
2026年我国网络安全发展形势展望

执行“寻找便宜鸡蛋”指令时，将“便宜”等同于“批量采购”，擅自下 089 单30美元的鸡蛋（实际市场价仅5美元）。二是智能体可进化性带来不可逆持续运行风险。2025年5月OpenAI的推理模型在安全测试中拒绝执行关机指令，并在篡改代码后主动清理操作痕迹。三是多智能体协作的级联效应使安全风险指数倍放大。2025年微软Copilot与Teams智能体协作时，攻击者通过邮件触发

10 积分 | 14 页 | 2.72 MB | 2 月前
3
Deepseek在药企研发领域的本地化部署和应用场景

代码和 Agent 能力上掀起效率革命。 · ChatGPT 上线实时视频能力，深入语音视觉实时多模态应用场景。 · 国内推理模型迅速跟进。 DeepSeek-R1 、 QwQ-32B-Preview 、 Kimi-k1.5 、 GLM-Zero 、 Skywork-o1 、 Step R- mini 、 ChatGLM 等首批模型相继发布。大模型的发展阶段智慧芽 @LS- GTM 智慧芽关键进展 3 o Deepseek 出圈引爆全行业的原因 ? · 基础能力：进入推理模型阶段，跻身全球第一梯队 · 推理能力跃升： DeepSeek 大模型核心技术突破，实现复杂推理任务的精准处理与高效执行，覆盖多模态场景应用。 · 国际竞争力对标：模型综合性能跃居全球第一梯队，技术指标与国际顶尖水平

10 积分 | 33 页 | 2.29 MB | 1 年前
3
2025年智启未来·险见新机-人保寿险大模型探索及实践（33页 PPT）

万亿参数典型的新技能学习曲线摘自北京大学 AI 肖睿团队团队作品大模型参数变化三个阶段摘自复旦大学大数据教学团队作品智慧涌现的关键 6 通用模型（ System 1 快思考模型）推理模型（ System 2 慢思考模型）模型代表 Qwen2.5-Max 、 DeepSeek-V3 、 GPT-4o QwQ-Max-Preview 、 DeepSeek-R1 、 OpenAI-o3

10 积分 | 33 页 | 2.82 MB | 6 月前
3
2025面向工程审计行业的DeepSeek大模型应用指南-南京审计大学工程审计学院(45页 WORD)

DeepSeek 的技术开发自己的模型、应用与产品。图 2-1 DeepSeek 系列模型最近引起全世界广泛关注的模型，主要是自研通用大模型 DeepSeek-V3 和推理模型 DeepSeek-R1。 DeepSeek-V3 是一款先进的通用大语言模型，具备多模态理解能力，旨在为广泛的应用场景提供智能化支持。 DeepSeek-R1 是一个推理大语言模型，旨在提供高效的自然语言理解、任务

10 积分 | 59 页 | 1.06 MB | 6 月前
3
2025年超节点发展报告-华为&中国信通院

幅提升，原本 MoE 模型训练需要 3 周时间，借助昇腾 384 超节点，时间将压缩至 1 周；基于昇思 MindSpore 进行了高性能的监督微调和 GRPO 强化学习训练框架的构建，发布开源数学推理模型 PCL-Reasoner-V1，率先突破大模型强化学习技术全栈壁垒，相关研究成果在国际顶级学术会议中发表，展现我国人工智能算法创新能力。同时，昇腾 384 超节点采用液冷技术，数据中心 PUE

20 积分 | 31 页 | 4.79 MB | 6 月前
3
电子AI+系列专题：DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求

在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI-o1 正式版。同时 DeepSeek 开源 R1 推理模型，允许所有人在遵循 MIT License 的情况下，蒸馏 R1 训练其他模型。 2023/05 2023/11 2024/02 2024/03 2024/05

10 积分 | 38 页 | 1.95 MB | 1 年前
3
全球智能驾驶辅助技术发展现状：技术路线、商业化落地与政策框架分析-先见AI-44页

，实现团雾预警、异常停车识别与编队通行引导；自动匝道汇入则依赖RSU与 OBU间毫秒级协同路侧系统提前3秒预测主路车流间隙，并向汇入车辆下发最优汇入速度与轨迹指令，实测成功率超92%。当前优化方向集中于轻量化边缘推理模型部署、异构V2X协议互通网关开发，以及“一杆多用”多功能智能杆集成标准落地[4]。参考文献答对先见AI 全球智能驾驶辅助技术发展现状:技术路线、商业化落地与政策框架分析 14 [

10 积分 | 44 页 | 1.37 MB | 2 月前
3

共 11 条前往

页

分类

语言

格式