积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(42)前沿探索(42)

语言

全部中文(简体)(42)

格式

全部PDF文档 PDF(33)PPT文档 PPT(8)DOC文档 DOC(1)
 
本次搜索耗时 0.018 秒,为您找到相关结果约 42 个.
  • 全部
  • 人工智能
  • 前沿探索
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 未来网络发展大会:2025东数西算算网协同调度业务场景白皮书

    4 协同训练场景................................................................................ 44 4.5 协同推理场景................................................................................ 66 4.6 西训东推场景.. 本文内容结构 本文的编制,是基于国家东数西算“安全新总线”项目所开展的 算网协同工程实践。深入分析“东数西算” 工程中的总分调度、分 总调度、混合调度的总体调度架构,东数西算、数据快递、东数西存、 协同推理、协同训练和西训东推等核心应用场景,以及边云一体、云 3 算分离和边缘共享等新型生态模式。同时,通过对典型应用场景的详 细的业务流程分析,力求为产业参与者提供可操作、可复制的交付参 考与决策 ● 流量调度,或者是需要算网协同调度平台对用户自治系统内部署的应 用副本和算网协同调度平台调度部署的应用副本间对终端用户的访 问请求做负载分担处理,所以需要在调度请求中携带自治系统中部署 的推理应用信息如<应用 ID、位置、域名、IP 地址>等。 图 3-6 分总调度-算网资源调度使用-北向调度 ② 全局缩略图方式调度  需求提交 12 当算力使用者通过自治系统进行算网调度操作时,如果本地资源
    20 积分 | 118 页 | 8.35 MB | 1 天前
    3
  • pdf文档 未来网络发展大会:算力城域网白皮书(2025版)

    青、张潇潇。 中关村超互联新基建产业创新联盟:袁博。 算力城域网白皮书(2025 版) I 前 言 2025 年初 DeepSeek 的爆火掀起了生成式人工智能的浪潮,带动 大模型训练成本和推理成本的快速下降,驱动算力需求爆炸式增长。 城域网络作为用户与算力资源间的关键桥梁,各类新兴算力业务对城 域网的网络架构、网络能力及服务模式等方面提出了新的要求。中国 电信在 2024 年发布了 .......29 7.4 云边协同训推场景....................................................................30 7.5 推理下发场景............................................................................31 八、总结与展望........ 随着通算、智算、超算技术的快速发展和广泛应用,算力需求呈 现爆炸式增长。2025 年以来,以大语言模型 DeepSeek 系列为代表的 人工智能,通过算法创新与工程优化解锁了更高的算力利用率,实现 训练成本与推理成本的显著降低,加速人工智能的落地部署与普惠化 发展,进一步催生了大量算力需求。根据《IDC 中国加速计算服务器 半年度市场跟踪报告》分析,2025 年中国智能算力规模将达到 1037EFLOPS,预计到
    20 积分 | 42 页 | 7.16 MB | 1 天前
    3
  • pdf文档 2025年超节点发展报告-华为&中国信通院

    CONTENTS 目录 超节点发展报告 02 当我们站在人工智能大模型技术飞速发展的十字路口,一个清晰的趋势已然浮现:大模型正沿着 “规模定律”不断演进,从预训练扩展到覆盖预训练、后训练、逻辑推理的全流程,其参数与集群 规模实现“双万” 跨越,行业模型落地需求专业化。 传统的服务器集群架构在这场变革中瓶颈愈发明显。千亿级模型一次梯度同步产生的 TB 级数据 让传统以太网带宽难以承受;同 GB/s 级通信带宽、 纳秒级时延、TB 级超大内存,实现集群能力跃迁。相较“服务器集群”,超节点代表的是弹性、池 化、开放的系统能力:既能以极致吞吐支撑万亿参数训练,也能以低时延满足企业级大规模推理的 刚性需求。 昇腾 AI 坚持架构创新,开源开放,共建产业生态。昇腾 AI 经过 6 年快速发展,已成长为中国 AI 算力第二平面的坚实基础,并通过软硬件开源开放,建立生态兼容、共建共享的昇腾 融合,锻造出高性能、高效率、高可靠的 单一逻辑实体。它标志着一个全新时代的开启——智算基础设施正从松散组合的算力堆叠阶段,迈 入软硬协同、全局优化的超节点阶段,旨在有效破解超大规模 AI 训练与推理中所面临的扩展性瓶颈、 效率损耗与能耗墙难题,为 AI 的持续创新提供坚实、高效、绿色的算力基座。 为系统分析超节点技术的发展逻辑、技术创新、产业价值以及未来趋势,我院与华为及相关单位 共同开展研究,编制《超节点发展报告》。报告以
    20 积分 | 31 页 | 4.79 MB | 1 天前
    3
  • pdf文档 DeepSeek大模型及其企业应用实践

    垂直大模型L2 1.4 大模型的分类 大语言模型可以分为通用大模型和推理大模型 推理大模型的概念大规模传播应该开始于 2 0 2 4 年 9 月 份 。 2 0 2 4 年 9 月 1 2 日 , OpenAI官方宣布了OpenAI o1推理大模 型。 推理大模型 在OpenAI的官网上,OpenAI定义推理模 型是在回答之前进行思考,并在回复用户 之前,在内部生成一长串的思维链过程。 理的方法。它让模型在得出最终答案之前, 先显式地写出推理的中间步骤。这就像人 类解决复杂问题时会先把思考过程写下来 一样。 OpenAI定义推理模型 也就是说,如果模型在回复你之前有一长 串的思考过程(这个过程必须可以显示输 出),探索了很多不同的路径之后给出答 案,那么有这个能力的大模型就是推理大 模型。推理模型的核心在于处理那些需要 多步骤逻辑推导才能解决的复杂问题。 推理模型的核心 1.4 大模型的分类 大模型的分类 n 推理大模型DeepSeek R1的对话效果 1.4 大模型的分类 Sebastian Raschka博士(Lightning AI的首席教育学家): 将“推理”定义为通过生成中间步骤来回答复杂问题的过程 2个简单的例子: 非推理问题: ”法国的首都是哪里?” (答案直接、无需推导) 推理问题: ”一列火车以每小时60英里的速度行驶3小时,行驶距离是多少?” (需
    10 积分 | 147 页 | 16.82 MB | 5 月前
    3
  • ppt文档 电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求

    557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 自然 语言推理等任务上,性能比肩 OpenAI-o1 正式版。 2 月 1 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 DeepSeek-R1 模型。 2 月 1 日,华为云官方发布消息,硅基流动和华为 云团队联合首发并上线基于华为云昇腾云服务 的 DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE 实现高效的推理和低成本训练,构建 DualPipe 算法和混合精度训练优化计算与通信负载;通过 ( 分阶段 ) 强化学习实现 性能突破。 多头潜在注意力 (MLA) DeepSeek-R1-Zero 通过强化学习架构创新实现突破性性能,核心技术创新体现在训 练效能优化策略、双维度评价体系、 结构化训练范式三个维度。 DeepSeek-R1 采用分阶段强化学习架构演进,包括冷启动阶段、面向推理的强化学习、拒绝采样 与监督式微调、全场景强化学习等。 l AI 应用爆发在即,算力需求持续攀升,关注 ASIC 及服务器产业链。 Scaling Law 与“涌现”能力是大模型训练遵循的重要法则,随着
    10 积分 | 38 页 | 1.95 MB | 5 月前
    3
  • word文档 2025面向工程审计行业的DeepSeek大模型应用指南-南京审计大学工程审计学院(45页 WORD)

    工 程数据与非结构化社会数据的融合分析,导致审计盲区与治理效能偏弱,工程审 计智能化转型迫在眉睫。 DeepSeek 大模型作为自主可控的新一代人工智能大模型,凭借多模态理解、 动态推理与领域自适应能力,能够为工程审计的效率提升提供支持。本指南 (V1.0) 旨在系统化阐明 DeepSeek 大模型在工程审计中的核心价值与应用路 径,推动工 程审计行业的智能化转型。 作为 1 章 DeepSeek 赋能工程审计 DeepSeek 凭借其强大的推理能力以及对中文的深度理解与优化,成为 AI 领 域自主可控的新一代人工智能大模型。尤其是其高效能与低成本的特点,极大地 降低了本地化部署和应用的门槛,这就为提升工程审计效率,创新工程审计方 式 创造了条件。DeepSeek 强大的学习和推理功能,可以为工程审计的多个领 域带 来显著的效率提升。DeepSeek 用大模型 DeepSeek-V3 和 推理模型 DeepSeek-R1。 DeepSeek-V3 是一款先进的通用大语言模型,具备多模态理解能力,旨在为 广泛的应用场景提供智能化支持。 DeepSeek-R1 是一个推理大语言模型,旨在提供高效的自然语言理解、任务 规划与交互能力,擅长处理复杂、需要多步思考的问题, 适合做深度推理、解决 代码问题或复杂数学问题等。 2.1
    10 积分 | 59 页 | 1.06 MB | 1 天前
    3
  • pdf文档 电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页

    大模型参数量级飞涨,相应训练集需同比提升。李开复定义 AI 2.0 时代的 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度, GPT-3 训练至少需要 3.2T 内存,至少 44 张 A100,推理任务则主要受显存限 制,需要 4 至 8 张 A100,因此完整的模型无法在终端上离线运行。 优化后大模型可在旗舰机型芯片上运行,AI 落地有望推动新一轮换机潮。 AI 部署本地化具有必要性,优势包括更低的延迟、更小的带宽、提高数据安 部署本地化具有必要性,优势包括更低的延迟、更小的带宽、提高数据安 全、保护数据隐私、高可靠性等。完整的大模型仅参数权重就占满一张 80G 的 GPU,但是通过量化、知识蒸馏、剪枝等优化,大模型可以在手机本地实 现推理。高通团队使用骁龙 8 Gen2 部署 Stable Diffusion,实现本地运营 15 秒出图,证明了大模型本地化运行的可能,也体现出目前手机芯片的局限 性。根据 IDC 数据,1Q23 全球手机销量中主处理器频率超过
    10 积分 | 25 页 | 2.20 MB | 5 月前
    3
  • ppt文档 电子AI+系列专题:复盘英伟达的AI发展之路

    GPU 通用型强,满足深度学习大量计算 的需求,因此 GPU 在训练负载中具有绝对优势。以 GPT-3 为例,在 32 位的单精度浮点数数据下,训练 阶段所需 GPU 数量为 1558 个,谷歌级应用推理阶段所 需 GPU 数量为 706315 个。 l 英伟达开辟 GPGPU 加速计算格局, GPU 架构演进及产品布局赋能 AI 时代。 英伟达 (NVIDIA) 成立于 1993 年,总部位于 变革初期就已参与并与 OpenAI 、微 软合作。 2023 年 3 月,英伟达在 GTC 大会上推出 4 个针对各种生成式 AI 应用程序进行优化的推理平台,其中发布带有双 GPU NVLink 的 H100 NVL 加速计算卡, 以支持 ChatGPT 类大型语言模型推理。与适用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 与双 GPU NVLink 的标准服 务器的速度最高可达 10 数增长而线性增长,这种现象被称为 Scaling Law 。 但当模型的参数量大于一定程度的时候,模 型能力 会突然暴涨 ,模型会突然拥有一些突 变能力 ( Emergent Ability ),如推理能力、无 标注学习 能力等。例如 GPT 之前的大语言模型主 流是深度神 经网络驱动,参数在数十亿水平,而 ChatGPT 达到 1750 亿参数。 全球数据量及数据中心负载量大幅上涨
    10 积分 | 30 页 | 1.27 MB | 5 月前
    3
  • ppt文档 2025年智启未来·险见新机-人保寿险大模型探索及实践(33页 PPT)

    6 通用模型( System 1 快思考模型) 推理模型( System 2 慢思考模型) 模型代表 Qwen2.5-Max 、 DeepSeek-V3 、 GPT-4o QwQ-Max-Preview 、 DeepSeek-R1 、 OpenAI-o3 运算原理 基于概率预测,通过大量数据训练来快速预测可能的答案 基于链式思维,逐步推理问题的每个步骤来得到答案 模型性能 响应速度快,适合即时任务 优势领域 函数调用、信息抽取、文本生成、创意写作、多轮对话、复杂角色扮演、打标、开放性问题,多样性高的 任务 数学推导、逻辑分析、代码生成、复杂问题拆解,逻辑密度高的任务 提示语 需显式引导推理步骤 提示语更简洁,只需明确任务目标和需求 适用场景 (功能点粒度) • 客服场景:做话术理解与意图分类,以及简单问题的回答;且时效性要求高 • 信息打标:对 析正负向情绪 及影响面 • 办公场景:会议助手、流程助手、公文撰写、知识问答等 • 信贷尽调报告助手:全网搜集企业多维度信息,结合审核规则、评价模型等进行推理决策,识 别风险点 • 投资研究:针对特定的政策内容或突发事件做深度解读,产出观点报告,支持决策 • 条款智能核验:把产品具体条款,对比知识库中监管和内规政策进行比对,判断是否合规,给
    10 积分 | 33 页 | 2.82 MB | 1 天前
    3
  • pdf文档 电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域

    5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 小模型,其中32B和70B模型在多项能力上实现对标OpenAI o1 mini。通 过推出高性能、低成本且开源的模型,DeepSeek给全球AI发展带来了模 ek给全球AI发展带来了模 型平权,同时也将刺激其他头部模型厂商加快推出性能更强、成本更具 竞争力的模型。而随着模型调用门槛降低,AI终端有望加速落地,而AI+ 快速发展也将反哺训练算力、推理算力需求。  AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 .. 7 图 7 :Grok 3 基准测试成绩 ............................................................ 7 图 8 :Grok 3 推理基准测试成绩 ........................................................ 7 图 9 :苹果近年营业收入 ...................
    10 积分 | 23 页 | 2.65 MB | 5 月前
    3
共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
前往
页
相关搜索词
未来网络发展大会2025东数西算算协同调度业务场景白皮皮书白皮书算力城域城域网年超节点报告华为中国信通DeepSeek模型及其企业应用企业应用实践电子AI系列专题重塑开源生态爆发持续推升需求面向工程审计行业指南南京大学学院45WORD电子行业边缘语言终端部署推动一轮新一轮20230531国信证券25复盘伟达年智启险见新机人保寿险探索33PPT深度平权关注及算力领域
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩