推理 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

深度推理驱动的Agent智能体构建研究-33页

20 积分 | 33 页 | 24.65 MB | 4 月前
3
中国推理算力市场追踪报告，2025H1-沙利文

1 中国推理算力市场追踪报告，2025年H1 头豹研究院弗若斯特沙利文咨询（中国） 2025年8月 2 关键发现  算力需求重心从训练转向推理，算力基础设施持续扩展与升级 AI算力消耗已从集中式训练转向大规模推理，带来前所未有的增量需求。2025年被认为是算力爆发的元年，推理算力的需求将迎来井喷式增长。推理算力的需求将在未来几年内远超训练算力。 01  2025年H1中国推理算力服务市场中，天翼云以【21 2025年H1中国推理算力服务市场中，天翼云以【21.4%】的市场份额领先中国日均Tokens消耗量从2024年初的1000亿增长到截至今年6月底，日均Token消耗量突破30万亿，1年半时间增长了300多倍，这反映了中国人工智能应用规模快速增长。天翼云息壤一体化智算服务平台率先完成国产算力与DeepSeek-R1/V3系列大模型的深度适配优化，成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。 02  未来推理算力长序列与超大模型推理优化成为关键，国产软硬件协同与生态成熟推动推理普及 03 中国算力正朝着“训推一体”融合架构快速发展，以支撑大规模模型与多模态应用的高效低延迟推理。国产AI芯片与推理框架不断优化，结合模型压缩、量化、动态推理等技术，进一步提升能效比和部署灵活性。 3 沙利文市场研读 | 2025/08 2 研究框架  中国推理算力市场综述 • 关键发现

10 积分 | 12 页 | 1.12 MB | 4 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek-R1 \ Kimi 1.5 及类强推理模型开发解读北大对齐小组陈博远北京大学2022级“通班” 主要研究方向：大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 算法的创新：GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways：RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based Methods 强推理路径对比 (DS-R1 \ Kimi-1.5 \ o-series) ➢ 蒸馏 vs. 强化学习驱动：国内外现有各家技术路线对比分析及Takeaways 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展：Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全：形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment ➢ 补充拓展：DeepSeek-V3 解读 3 DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ OpenAI

10 积分 | 76 页 | 8.39 MB | 10 月前
3
英特尔公有云和互联网创新实践

37 CONTENT 目录 Large Language Model (LLM) 大语言模型 3 4 阿里云引入第五代至强® 可扩展处理器，实现 ECS g8i 算力再升级，为大模型 AI 推理加速添新解，更易得、更易用、可扩展性强，满足从小模型到超大模型的各类需求。 • 使用处理器内置的 AI 加速引擎 -- 英特尔® AMX 和英特尔® AVX-512，提升并行计算和浮点运算能力；参数级别的大语言模型分布式推理文生图创意辅助工具 AI 生成代码虚拟助手 1.2.3 数据来源于阿里云未公开的内部测试，如欲了解更多详情，请联系阿里云：https://www.aliyun.com 英特尔并不控制或审计第三方数据。请您审查该内容，咨询其他来源，并确认提及数据是否准确。算力需求激增：视频、数据库等场景算力需求激增智能化应用普及：大模型推理需求爆炸式增长数据安全挑战：数据隐私及安数据安全挑战：数据隐私及安全需求增强 85% 整机性能提升高达 1 7 倍 AI 推理性能提升高达 2 50% 中小参数模型起建成本降低 3 4 白皮书 | 用友采用第五代英特尔® 至强® 可扩展处理器加速自然语言处理 (NLP) 应用助力企业服务数智化转型图 3. 第五代英特尔® 至强® 可扩展处理器具备强大性能为 AI 加速而生的处理器以针对工作负载优化的性能实现业务增长和飞跃

10 积分 | 38 页 | 12.52 MB | 10 月前
3
未来网络发展大会：2025东数西算算网协同调度业务场景白皮书

4 协同训练场景................................................................................ 44 4.5 协同推理场景................................................................................ 66 4.6 西训东推场景.. 本文内容结构本文的编制，是基于国家东数西算“安全新总线”项目所开展的算网协同工程实践。深入分析“东数西算” 工程中的总分调度、分总调度、混合调度的总体调度架构，东数西算、数据快递、东数西存、协同推理、协同训练和西训东推等核心应用场景，以及边云一体、云 3 算分离和边缘共享等新型生态模式。同时，通过对典型应用场景的详细的业务流程分析，力求为产业参与者提供可操作、可复制的交付参考与决策 ● 流量调度，或者是需要算网协同调度平台对用户自治系统内部署的应用副本和算网协同调度平台调度部署的应用副本间对终端用户的访问请求做负载分担处理，所以需要在调度请求中携带自治系统中部署的推理应用信息如<应用 ID、位置、域名、IP 地址>等。图 3-6 分总调度-算网资源调度使用-北向调度 ② 全局缩略图方式调度  需求提交 12 当算力使用者通过自治系统进行算网调度操作时，如果本地资源

20 积分 | 118 页 | 8.35 MB | 4 月前
3
北京大学-DeepSeek原理和落地应用2025

…… l 行业模型（垂直模型、垂类模型） Ø 教育、医疗、金融等大模型的前世今生 •人工智能：让机器具备动物智能，人类智能，非人类智能（超人类智能） •运算推理：规则核心；自动化 •知识工程：知识核心；知识库+推理机 •机器学习：学习核心；数据智能（统计学习方法，数据建模） •常规机器学习方法：逻辑回归，决策森林，支持向量机，马尔科夫链，….. •人工神经网络：与人脑最大的共同点是名字，机制和架构并不一样 ref:中文大模型基准测评2024年度报告(2025.01.08) 推理模型生成模型与推理大模型的对比比较项 OpenAI GPT-4o（生成模型） OpenAI o1（推理模型）模型定位专注于通用自然语言处理和多模态能力，适合日常对话、内容生成、翻译以及图文、音频、视频等信息处理、生成、对话等。侧重于复杂推理与逻辑能力，擅长数学、编程和自然语言推理任务，适合高难度问题求解和专业领域应用。一般是在生成模型的务，适合高难度问题求解和专业领域应用。一般是在生成模型的基础上通过RL方法强化CoT能力而来推理能力在日常语言任务中表现均衡，但在复杂逻辑推理（如数学题求解）上准确率较低。在复杂推理任务表现卓越，尤其擅长数学、代码推理任务。多模态支持支持文本、图像、音频乃至视频输入，可处理多种模态信息。当前主要支持文本输入，不具备图像处理等多模态能力。应用场景适合广泛通用任务，如对话、内容生成、多模态信息处理以

10 积分 | 57 页 | 9.65 MB | 10 月前
3
中国移动：云智算技术白皮书（2025）

4 异构混训 .............................. 15 2.5.3 推理框架 .....................................16 2.5.3.1 推理并行效能优化 ...................... 16 4 2.5.3.2 推理网关优化 .......................... 16 2.5.3.3 融合算子监控超现有资源池化的调度能力；在网络层面，AI 训练中 TB 级参数同步对时延极为敏感，传统网络架构难以满足低时延、高吞吐的传输要求；在服务形态上，单一的 IaaS/PaaS 服务无法全面覆盖数据处理、模型训练、推理部署等 AI 开发全链路的需求，迫切需要构建适应智能时代的云计算新范式。 1.2 云智算的内涵云智算是通过算网基础设施与人工智能核心技术深度融合，提供一体化算网资源、全栈式开发环境、一 IaaS、PaaS、SaaS 三层拓展为 AI IaaS、AI PaaS、MaaS、AI SaaS 四层。一是 AI IaaS，即算网一体化供给的基础设施服务，通过泛在网络推动东中西、云边端、通智超量、训练推理等多类型算力“联算成网”，依托算网统一编排的算网大脑，实现算力的灵活调度、即取即用。二是 AI PaaS，即面向各类 AI 开发者的工具平台服务，提供覆盖 AI 研发、运营、测试等全环节的工具链和开发环境，显著提升全社会

0 积分 | 30 页 | 716.31 KB | 10 月前
3
全球计算联盟GCC：2025年异构算力协同白皮书

....................................................................................20 4.2 低成本异构混合推理................................................................................................... 推到极致，也带来高耗电和高昂的成本，2025 年推出 Blackwell B200，并抛出 2026–2027 路线图，Vera Rubin 与 Rubin Ultra 已在路上，Rubin 推理峰值 50 PFLOPS、HBM4 内存 288 GB，FP4 稀疏算力是 B200 的 2.5 倍。（2）AMD 把 Chiplet 思路发挥到极致，多颗小 Die 通过 Infinity 均划分， 7 但其在异构算力下平均分配因其计算能力、传输能力差异性造成模型计算量处理不同步、集合通信数据传输有堵点，“快等慢”造成部分资源浪费。针对大模型推理过程，由于预填充和解码阶段对算力和显存的需求量不同，传统大模型推理过程算力显存阶段互为瓶颈，造成低水平资源利用率，需要解决异构算力协同调度问题使其匹配到最优计算任务。 8 第二章算力协同体系架构为了打破异构算力生态壁

10 积分 | 31 页 | 1.21 MB | 4 月前
3
未来网络发展大会：算力城域网白皮书（2025版）

青、张潇潇。中关村超互联新基建产业创新联盟：袁博。算力城域网白皮书（2025 版） I 前言 2025 年初 DeepSeek 的爆火掀起了生成式人工智能的浪潮，带动大模型训练成本和推理成本的快速下降，驱动算力需求爆炸式增长。城域网络作为用户与算力资源间的关键桥梁，各类新兴算力业务对城域网的网络架构、网络能力及服务模式等方面提出了新的要求。中国电信在 2024 年发布了 .......29 7.4 云边协同训推场景....................................................................30 7.5 推理下发场景............................................................................31 八、总结与展望........ 随着通算、智算、超算技术的快速发展和广泛应用，算力需求呈现爆炸式增长。2025 年以来，以大语言模型 DeepSeek 系列为代表的人工智能，通过算法创新与工程优化解锁了更高的算力利用率，实现训练成本与推理成本的显著降低，加速人工智能的落地部署与普惠化发展，进一步催生了大量算力需求。根据《IDC 中国加速计算服务器半年度市场跟踪报告》分析，2025 年中国智能算力规模将达到 1037EFLOPS，预计到

20 积分 | 42 页 | 7.16 MB | 4 月前
3
英特尔-教育行业AI实战手册2024

英特尔携手合作伙伴探索基于语音识别的智能教学辅助能力 • 语音识别等人工智能技术在智慧教育场景中的应用 • 基于语音识别能力构建教学辅助能力 • 扩展 OpenVINO ™ 工具套件自定义层，提升语音识别推理效率基于英特尔优化方案的应用案例 • 思必驰：与英特尔携手打造精准、高效的语音识别应用，加速智慧教育前行步伐打造高效人工智能教学与实训解决方案英特尔携手合作伙伴持续探索人工智能教学场景建设基于英特尔优化方案的应用案例 • 联合伟世：“云 - 边 - 端” 协同，采用先进硬件与创新理念打造高效人工智能教学实训平台 • 五舟科技：高性能硬件助力打造高校人工智能教学平台优化方案设计、提升推理性能，助力智能课堂行为分析英特尔与合作伙伴共同探索课堂行为分析在智慧教育场景中的应用 • 人工智能行为分析解决方案开发及挑战 • 面向教育场景的行为分析方案设计 • 针对行为分析的英特尔产品优化方案 IT 基础设施也面临着严峻挑战。如图 1-1-3 所示，这些挑战包括： • 人工智能应用对算力的高要求：与学校已有的校园网、电子白板、平板电脑等信息化设备相比，人工智能应用因其数据量大、推理要求高、计算负载密集等特点，要求学校信息化系统具有更高的算力。 • 人工智能应用如何与教学环节无缝对接：与教学环节的紧密结合，使人工智能应用有别于传统多媒体课件等校园信息化应用，尤其是

10 积分 | 40 页 | 4.85 MB | 10 月前
3

共 373 条前往

页

分类

语言

格式

深度推理驱动的Agent智能体构建研究-33页

中国推理算力市场追踪报告，2025H1-沙利文

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

英特尔公有云和互联网创新实践

未来网络发展大会：2025东数西算算网协同调度业务场景白皮书

北京大学-DeepSeek原理和落地应用2025

中国移动：云智算技术白皮书（2025）

全球计算联盟GCC：2025年异构算力协同白皮书

未来网络发展大会：算力城域网白皮书（2025版）

英特尔-教育行业AI实战手册2024