推理 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

深度推理驱动的Agent智能体构建研究-33页

20 积分 | 33 页 | 24.65 MB | 6 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读北大对齐小组陈博远北京大学2022级“通班” 主要研究方向：大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 算法的创新：GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways：RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based Methods 强推理路径对比 (DS-R1 \ Kimi-1.5 \ o-series) ➢ 蒸馏 vs. 强化学习驱动：国内外现有各家技术路线对比分析及Takeaways 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展：Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全：形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment ➢ 补充拓展：DeepSeek-V3 解读 3 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ OpenAI

10 积分 | 76 页 | 8.39 MB | 1 年前
3
未来网络发展大会：2025东数西算算网协同调度业务场景白皮书

4 协同训练场景................................................................................ 44 4.5 协同推理场景................................................................................ 66 4.6 西训东推场景.. 本文内容结构本文的编制，是基于国家东数西算“安全新总线”项目所开展的算网协同工程实践。深入分析“东数西算” 工程中的总分调度、分总调度、混合调度的总体调度架构，东数西算、数据快递、东数西存、协同推理、协同训练和西训东推等核心应用场景，以及边云一体、云 3 算分离和边缘共享等新型生态模式。同时，通过对典型应用场景的详细的业务流程分析，力求为产业参与者提供可操作、可复制的交付参考与决策 ● 流量调度，或者是需要算网协同调度平台对用户自治系统内部署的应用副本和算网协同调度平台调度部署的应用副本间对终端用户的访问请求做负载分担处理，所以需要在调度请求中携带自治系统中部署的推理应用信息如<应用 ID、位置、域名、IP 地址>等。图 3-6 分总调度-算网资源调度使用-北向调度 ② 全局缩略图方式调度  需求提交 12 当算力使用者通过自治系统进行算网调度操作时，如果本地资源

20 积分 | 118 页 | 8.35 MB | 6 月前
3
从大模型、智能体到复杂AI应用系统的构建(61页 PPT)

AI 应用系统的构建 —— 以产业大脑为例肖俊浙江大学计算机学科与技术学院人工智能研究所 2025 03 杭州 • 大模型推理能力快速提升 • 推理模型和思维链 (CoT) • 智能体是什么？ • 四链融合产业大脑案例提纲大模型推理能力快速提升开始模仿人脑进行大量数据的标记和训练神经网络 CNN RNN GAN 1990 年开始； 2006 大语言模型易产生幻觉，在数学推理方面表现在推理能力严重不足，体现在简单数值比较错误、多步推理能力弱、推理不一致等早期大模型在推理能力上存在明显短板 9.11>9.9? 简单数值比较错误多步推理错误事实性幻觉问题大语言模型易产生幻觉，在数学推理方面表现在推理能力严重不足，体现在简单数值比较错误、多步推理能力弱、推理不一致等早期大模型在推理能力上存在明显短板早期大模型在推理能力上存在明显短板无法在复杂的思维链中保持一致性推理过程和答案不一致 Yann LeCun 的批判观点：对纯粹扩大规模方法的根本质疑 Mehrdad Farajtabar ： "LLM 本质上是统计模式匹配工具，而非真正的推理系统 " 、 " 下一个词预测框架不足以产生真正的理解 " Yann LeCun

20 积分 | 61 页 | 13.10 MB | 6 月前
3
华为昇腾DeepSeek解决方案

CANN … 互联技术：灵衢 AI 芯片：昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 升级，模型能力 = 算力 x 数据 x 思考 + 逻辑推理 DeepSeek-V3/R1 OpenAI-o1/o3 算力 x 数据重新定义 Scaling Law 延续智能涌现的方向 2017 谷歌发布首个 Transformer Restricted Distribution 下一代 AI 技术 Mamba 、空间智能等算力 x 数据 x 思考模型效果低成本完美对标 OpenAI O1 ，突破精确语义理解及复杂推理任务 DeepSeek-V3 是一款 MoE 模型，总参数量 671B ，激活参数量 37B ，采用 2048 张 H800 （节点内 NVLink ，节点间 IB ，非超节点架构）在 14.8T 自我验证机制： AI 的 " 错题本系统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA ：空间压缩术训练框架加速： 16 到 3 的量化压缩，通信降低 89% 推理加速：预加载，动态批处理等模型、数据、工具链、部署全开源蒸馏技术使能第三方模型性能 DeepSeek V3 ：实现极致性能，稀疏 MOE 提质降本技术创新硬件级、算法级、架构级、工程级、开

0 积分 | 32 页 | 2.52 MB | 1 年前
3
未来网络发展大会：算力城域网白皮书（2025版）

青、张潇潇。中关村超互联新基建产业创新联盟：袁博。算力城域网白皮书（2025 版） I 前言 2025 年初 DeepSeek 的爆火掀起了生成式人工智能的浪潮，带动大模型训练成本和推理成本的快速下降，驱动算力需求爆炸式增长。城域网络作为用户与算力资源间的关键桥梁，各类新兴算力业务对城域网的网络架构、网络能力及服务模式等方面提出了新的要求。中国电信在 2024 年发布了 .......29 7.4 云边协同训推场景....................................................................30 7.5 推理下发场景............................................................................31 八、总结与展望........ 随着通算、智算、超算技术的快速发展和广泛应用，算力需求呈现爆炸式增长。2025 年以来，以大语言模型 DeepSeek 系列为代表的人工智能，通过算法创新与工程优化解锁了更高的算力利用率，实现训练成本与推理成本的显著降低，加速人工智能的落地部署与普惠化发展，进一步催生了大量算力需求。根据《IDC 中国加速计算服务器半年度市场跟踪报告》分析，2025 年中国智能算力规模将达到 1037EFLOPS，预计到

20 积分 | 42 页 | 7.16 MB | 6 月前
3
智算中心暨电力大模型创新平台解决方案（51页PPT)

主要承载模型训练以及适合中心推理、多媒体渲染等业务，支撑各行业数智化转型升级具有较强的普适性，可服务于 toB/toC 适合有智能化转型需求行业，如自动驾驶、智慧城市， toB 为主专用性强，主要面向地球物理、分子力学等基础学科以及军工研究注 [1] ：行业中 GPU 是一个较为泛化的概念，从功能角度划分， GPU 特指具备图形渲染能力的硬件， AI 加速卡特指用于 AI 推理或训练的硬件。本材料主要针对应用价值：自然语言理解工单，响应效率提升 50% ，改善用户体验，提高客服工作效率。国产化适配：采用寒武纪 NPU 推理 + 中文预训练模型，适配国产推理芯片和语言模型。主流场景及需求 l 人工智能平台数据处理模型开发模型训练自动建模模型部署模型推理模型管理模型监控主要包括 AI 智算集群、超算集群、高速网络、通用计算集群、高性能存储集群、安全中心、云管平台、运维平台等。平台安全运

10 积分 | 51 页 | 4.74 MB | 6 月前
3
英特尔-教育行业AI实战手册2024

英特尔携手合作伙伴探索基于语音识别的智能教学辅助能力 • 语音识别等人工智能技术在智慧教育场景中的应用 • 基于语音识别能力构建教学辅助能力 • 扩展 OpenVINO ™ 工具套件自定义层，提升语音识别推理效率基于英特尔优化方案的应用案例 • 思必驰：与英特尔携手打造精准、高效的语音识别应用，加速智慧教育前行步伐打造高效人工智能教学与实训解决方案英特尔携手合作伙伴持续探索人工智能教学场景建设基于英特尔优化方案的应用案例 • 联合伟世：“云 - 边 - 端” 协同，采用先进硬件与创新理念打造高效人工智能教学实训平台 • 五舟科技：高性能硬件助力打造高校人工智能教学平台优化方案设计、提升推理性能，助力智能课堂行为分析英特尔与合作伙伴共同探索课堂行为分析在智慧教育场景中的应用 • 人工智能行为分析解决方案开发及挑战 • 面向教育场景的行为分析方案设计 • 针对行为分析的英特尔产品优化方案 IT 基础设施也面临着严峻挑战。如图 1-1-3 所示，这些挑战包括： • 人工智能应用对算力的高要求：与学校已有的校园网、电子白板、平板电脑等信息化设备相比，人工智能应用因其数据量大、推理要求高、计算负载密集等特点，要求学校信息化系统具有更高的算力。 • 人工智能应用如何与教学环节无缝对接：与教学环节的紧密结合，使人工智能应用有别于传统多媒体课件等校园信息化应用，尤其是

10 积分 | 40 页 | 4.85 MB | 1 年前
3
2025年超节点发展报告-华为&中国信通院

CONTENTS 目录超节点发展报告 02 当我们站在人工智能大模型技术飞速发展的十字路口，一个清晰的趋势已然浮现：大模型正沿着 “规模定律”不断演进，从预训练扩展到覆盖预训练、后训练、逻辑推理的全流程，其参数与集群规模实现“双万” 跨越，行业模型落地需求专业化。传统的服务器集群架构在这场变革中瓶颈愈发明显。千亿级模型一次梯度同步产生的 TB 级数据让传统以太网带宽难以承受；同 GB/s 级通信带宽、纳秒级时延、TB 级超大内存，实现集群能力跃迁。相较“服务器集群”，超节点代表的是弹性、池化、开放的系统能力：既能以极致吞吐支撑万亿参数训练，也能以低时延满足企业级大规模推理的刚性需求。昇腾 AI 坚持架构创新，开源开放，共建产业生态。昇腾 AI 经过 6 年快速发展，已成长为中国 AI 算力第二平面的坚实基础，并通过软硬件开源开放，建立生态兼容、共建共享的昇腾融合，锻造出高性能、高效率、高可靠的单一逻辑实体。它标志着一个全新时代的开启——智算基础设施正从松散组合的算力堆叠阶段，迈入软硬协同、全局优化的超节点阶段，旨在有效破解超大规模 AI 训练与推理中所面临的扩展性瓶颈、效率损耗与能耗墙难题，为 AI 的持续创新提供坚实、高效、绿色的算力基座。为系统分析超节点技术的发展逻辑、技术创新、产业价值以及未来趋势，我院与华为及相关单位共同开展研究，编制《超节点发展报告》。报告以

20 积分 | 31 页 | 4.79 MB | 6 月前
3
金融-DeepSeek银行部署加速，AI金融应用迎来跃迁

. 1 3 专业｜领先｜深度｜诚信中泰证券研究所 n DeepSeek 开源使金融机构能够轻松获得前沿模型能力，且大幅降低部署成本。其通过对训练方式、算法架构和推理方法的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果，有望进一步催生银行落地应用。 R1-Zero 版本模型使用纯强化学习方法。随训练过程推进，模型展现出了推理能力的扩展（高准确率和 long-CoT 能力涌现等）。图表：随步数提升 R1-Zero 的 AIME 任务准确度图表：深度思考能力提升性能：后训练阶段大规模应用强化学习，表现推理能力扩展资料来源： DeepSeek-R1: Incentivizing Attention ， MLA ）进行优化；在后训练阶段采用冷启动 + 大规模强化学习方式，不再使用传统 SFT 做大规模监督微调，甚至绕过了一些 CUDA ，采用 PTX 汇编来提升能力；在推理场景下通过大规模跨节点专家并行（ Expert Parallelism ， EP ）来优化通信开销，尽可能实现负载均衡。图表： DeepSeek R1 架构图

10 积分 | 25 页 | 1.44 MB | 6 月前
3

共 163 条前往

页

分类

语言

格式

深度推理驱动的Agent智能体构建研究-33页

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

未来网络发展大会：2025东数西算算网协同调度业务场景白皮书

从大模型、智能体到复杂AI应用系统的构建(61页 PPT)

华为昇腾DeepSeek解决方案

未来网络发展大会：算力城域网白皮书（2025版）

智算中心暨电力大模型创新平台解决方案（51页PPT)

英特尔-教育行业AI实战手册2024

2025年超节点发展报告-华为&中国信通院

金融-DeepSeek银行部署加速，AI金融应用迎来跃迁