积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部维度学堂(44)白皮书(35)政策法规(4)工具模板(2)书籍精华(2)国标标准(1)

语言

全部中文(简体)(43)

格式

全部PDF文档 PDF(39)DOC文档 DOC(4)PPT文档 PPT(1)
 
本次搜索耗时 0.037 秒,为您找到相关结果约 44 个.
  • 全部
  • 维度学堂
  • 白皮书
  • 政策法规
  • 工具模板
  • 书籍精华
  • 国标标准
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • DOC文档 DOC
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 全球计算联盟GCC:2025年异构算力协同白皮书

    .................................................................................20 4.1 “一模多芯”异构混池训练............................................................................................20 4.2 XPU-R,自研 XPU-Link 全互联架构,搭建“芯片—XPU-Lite 框架— 千卡 1.2 TB/s XPU-Link 集群—百度文心大模型”四级闭环,已在百度内部提供 90%以上文 心系列训练算力,日均稳态负载 85%+。 (3)壁仞科技采用 Chiplet 架构设计大算力芯片,其首款 GPGPU(General-Purpose Computing on Graphics Processing 对既有框架进行适配时,因其进度不同具有代际差,使得在多种硬件架构上运行相同的计算 实例时,所依赖的软件环境存在不一致性。 (3)异构算力基于现有调度机制协同“效率低”,因其算存传均有差异导致无法从应 用层映射到最佳硬件:针对传统训练框架,并行策略是按照其算力芯片数量进行平均划分, 7 但其在异构算力下平均分配因其计算能力、传输能力差异性造成模型计算量处理不同步、集 合通信数据传输有堵点,“快等慢”造成部分资源浪费。针对大模型推理过程,由于预填充
    10 积分 | 31 页 | 1.21 MB | 2 天前
    3
  • pdf文档 湖南大学:2025年智算中心光电协同交换网络全栈技术白皮书

    月异,推动以智算中心 为代表的基础设施向更高效、更弹性的方向快速发展。 2025 年 1 月 1 日,国家发展改革委等联合印发《国家数据基础 设施建设指引》[1]强调高效弹性传输网络可为大模型训练和推理等核 心场景数据传输流动提供高速稳定服务,在高效弹性传输网络支撑下, 能够显著提升数据交换性能,降低数据传输成本。 7 月 26 日,李强总理出席 2025 世界人工智能大会暨人工智能全 随着人工智能与实体经济深度融合,智算需求已经呈现爆发式增 长。AIGC 大模型参数量达到万亿,训练阶段需要万卡甚至十万卡集 群支持。如表 1-1 所示,训练万亿级模型(如 GPT-4)已突破万亿(10²⁵) FLOPs,需数千至万块 H100 级芯片,训练成本达上亿美元。 表 1-1 不同规模模型的算力需求估算 模型规模 典型硬件 GPU 数量 训练成本(美元) 1 亿~10 亿 V100/A100(数十卡) <100 10M-100M 万亿级+ H100/B100(数万卡) >20,000 100M-500M+ 大模型参数量达到万亿,迭代训练需使用数据并行、流水线并行、 张量并行和专家并行等技术。并行推理将每个模型层的计算任务拆分 到各个服务器中多卡 GPU 上执行。各 GPU 无法独立完成计算工作。 在训练的过程中需要进行频繁且复杂的通信。这就要求构建 GPU 之 间的全互联高速数据通道,以确保数据的高效传输,最大限度减少
    20 积分 | 53 页 | 1.71 MB | 2 天前
    3
  • pdf文档 阿里云:2025年阿里云百炼安全白皮书

    AI 基础设施作为大模型服务正常运行的基础支撑,下述威胁直接影响大模型服务的稳 定性、安全性和商业可持续性。 ● AI 供应链漏洞风险:AI 常用的训练与推理框架、平台软件中常存在公开的高危漏洞。 若未及时修复,攻击者可借此入侵系统,控制训练环境或业务平台,导致数据泄露、 服务中断,甚至影响关键社会领域,造成严重后果; ● 拒绝服务风险:AI 系统易受分布式拒绝服务(DDoS)攻击。攻击者通过海量恶意 大模型在技术原理上具有天然的局限性,面临全生命周期的风险挑战。 ● 算法合规风险:大模型全生命周期需要遵循明确的法规和技术标准要求,包括但不 限于训练数据来源、数据预处理、数据标注、输出内容、内容标识等方面; ● 内容安全风险:由于训练数据的偏差和污染,以及模型生成机制的不完全可控,可 能生成违法违规不良价值观的内容; ● 对抗攻击风险:攻击者可通过构造对抗样本或指令注入攻击,诱导模型生成错误的 成错误的 回答。 2.3 应用服务安全风险:算力消耗、供应链与隐私泄露 MaaS 平台在提供便捷服务的同时,也产生了特有的安全隐患。 ● 数据安全与隐私风险:攻击者可通过特定提示诱导模型泄露训练数据等商业秘密。 此外,用户与模型之间的交互链路若未采取充分的安全保护措施,也可能导致数据外 泄; ● 算力消耗风险:攻击者通过提交大量高复杂度请求,在不触发传统 DDoS 防护机制 的前提下,耗尽
    20 积分 | 59 页 | 45.36 MB | 2 天前
    3
  • pdf文档 面向新型智算中心的以太网弹性通道(FlexLane)技术白皮书(2025年)

    大模型崛起,算力需求呈指数级增长, 全球正加速建设智算中心以应对这一挑战。智算中心内部或智算中心间海量的数 据交换,对网络链路的可靠性提出了前所未有的要求。任何链路闪断或中断都可 能导致 AI 训练任务失败,造成巨大的时间和资源浪费。然而,光模块的成本与 可靠性瓶颈以及大规模集群中链路数量的激增,使得已有技术难以满足新型智算 中心 AI 业务对可靠性的需求。 本白皮书面向新型智算中心逐渐以承载 链路高可靠技术构想。该技术基于高速接口多通道架构的现状,打破原 有固定组合,引入灵活多通道架构,通过降速运行实时有效的规避任何通道发生 的故障,将链路可靠性提升万倍以上(助力 AI 网络互联可靠性超越 5 个 9),保 障 AI 训练和推理业务不受影响。FlexLane 技术支持在现有设备上通过软件升级快 速部署,或升级硬件实现更优的性能,同时可支持主动降速,在链路轻载和空闲 期间动态节能,为智算中心提供灵活、经济、高效的可靠性保障。 ChatGPT、Deepseek 为代表的大语言模型(LLM)的兴起,标志着 AI 进入了一个全新的发展阶段。大 模型通常拥有数千亿甚至万亿的参数,中小模型通常也有十亿参数以上,需要海 量的算力进行训练和推理。为满足庞大的算力需求,智算中心作为 AI 发展的新 型基础设施底座,正加速在全球范围内建设和部署。 图 1-1 传统数据中心与新型智算中心流量模型对比 传统数据中心主要承载企业级应用,提供云服务,如
    0 积分 | 24 页 | 2.92 MB | 5 月前
    3
  • pdf文档 AI+HR黑科技秘笈-AI赋能人力资本智能化变革

    岗匹配大致 经历了三个阶段,“三历对照法”、“冰山挖掘法”、“全人匹配法”,而 AI 技术的引用将为企业迎 来第四个——“数据解剖法”。 AI 技术实现人岗匹配,离不开数据的处理和模型的选择与训练,看似高深、复杂的人岗匹配算 法模型背后,这一切是怎么实现的呢?本期院长就和大家探讨下不同模型在人岗匹配实践中的 创新应用。 “人岗匹配” 是企业人力资源管理的核心问题,更是所有 HR 追求的目标。毫不夸张地说,“人 不是很乐观。因此分析原因可能是某些特征缺失 ID(比如 CV 职能等)初始化为 0 导致,还存 在的原因可能是由于 ID vector 的知识结构和文本 embedding 知识结构不同导致,此处知识结 构可以理解为不同训练任务下的 embedding 空间结构。 6 第一部分 | 图 3 经历了 DNN 尝试没带来正向收益我们偏向于以线性和深度非线性结合的 Wide&Deep 结构(如 图 4)进行适配,此时我们考虑到 现阶段成果和未来展望 表 1 以上结果都为数据清洗特征工程后结果,本次数据量 JD 和 CV 对大致为 86 万,其中负例和正 例比大致为 7:1,我们将其随机分成 8:1:1 其中 8 成训练集、1 成训练集和 1 成测试集。 4.2 未来展望 > 特征为王说法不无道理,在加入深度学习探索时应该思考数据质量与数据量是否能支持,在数 据质量和量的保证下我们相信深度学习带来的魅力是巨大的。最近由
    20 积分 | 98 页 | 8.41 MB | 14 天前
    3
  • word文档 医疗健康大模型伦理与安全白皮书(93页 WORD)

    病诊断 、 个性化治疗等, 同时指出其面临的 数据隐私安全 、 质量 一致性 、 伦理问题 、 技术基础设施及法规合规等挑战 ; 介绍开发技术框架 及数据收 集 、 训练 、 部署 、 推理应用 等环 节的技术要点 ; 说明行业大模型 在医疗领域应用框架的各组件功能;通过实例给出大模型最佳实践建议。 其二, 介绍通用大模型评测框架的任务定义 、 数据准备和评测方法 9 2.2.2.数据收集和构建 10 2.2.3.训练 12 2.2.4.部署 概述 1.1 大语言模型技术发展概述 近年来人工智能(AI)技术的飞速发展,各行各业正在经历一场颠覆式的科技革命,早期的模型以 判别式为主,主要通过大量的自然语言预训练语料,来让模型学习词句的语意,从而实现文本分类 、命名实体识别(NER)、关系抽取等偏向于理解的任务,此类判别式模型也通常只能解决该场景 下的 特定任务 , 迁移 性和 可扩 展性 较 为有 限
    20 积分 | 93 页 | 12.19 MB | 14 天前
    3
  • word文档 医疗健康场景引入DeepSeek AI大模型可行性研究报告(144页 WORD)

    ............................................................................53 3.3 DeepSeek 模型的开发与训练................................................................................................... .........................................................................................59 3.3.2 训练数据集的构建............................................................................................. 提出了更高 的要求。例如,在疾病诊断、治疗方案推荐和患者预后预测等方 面,精准的预测模型能够帮助医生做出更加科学的决 策。DeepSeek 在预测分析方面的优势在于其能够通过大量的历史 数据训练出高精度的模型,并结合实时的患者数据进行动态预测。 这不仅提高了诊断的准确性,还为个性化医疗提供了强有力的技术 支持。 在实际应用中,DeepSeek 的引入还能够显著降低医疗机构的 运营成
    20 积分 | 151 页 | 370.68 KB | 14 天前
    3
  • pdf文档 上海科学智能研究院:2025年科学智能白皮书

    关联,打造“灰盒模型”,提高模型的可信 度和计算效率。开发跨尺度、多模态统一的 神经网络架构,用于从微观到宏观的统一建 模。 2.2.2 如何提升 AI 模型在科学研究中的 泛化性 AI 模型依赖大规模训练数据,而高质量 的科学数据往往有限。在数据有限的情况下, 模型可能无法学习到有效的特征,难以适应 新的领域或任务,限制了其在实际科学问题 中的应用。 为了解决这一挑战,可以从以下几个方 面寻找突破路径: 展现出向通用人工智能演进的巨大潜力,具 有重要的研究和应用价值。学术界与工业界 纷纷将目光聚焦于大语言模型的相关研究, 力图突破计算复杂度高、安全对齐难、可解 释性弱等短板。与此同时,随着训练数据、 算力资源逐渐面临增长瓶颈,研究者正积极 寻找继续提升模型能力的第二扩展定律,推 动模型向知识增强 4、多模态融合 5,6 和深度 推理 7,8 方向演进,逐步催生出具备自主学 习和决策能力的智能体系统 奠定了坚实 基础。 1.2 最新进展 以大语言模型为核心的人工智能技术正 迈入全新发展阶段。在训练数据和算力资源 逐渐趋于饱和的背景下,研究者开始探索“第 二扩展定律”,即从训练阶段的规模效应延 伸到推理阶段,通过模型架构革新与软硬件 协同设计,实现参数效率的指数级提升 10, 进而大幅降低训练和推理的能耗。这一战略 转变为持续推动模型能力升级提供了新路 径。在技术演进方面,研究者聚焦于多个前
    20 积分 | 29 页 | 2.74 MB | 5 月前
    3
  • pdf文档 2025年应用全生命周期智能化白皮书

    力重构。 从技术视角看,AI-Native 架构的关键在于数据与 API 的智能融合,传统企业系统沉淀的海量数据,需通过统一的 可信数据资产目录实现跨域流通,为 Agent 提供实时、高质量的训练与推理燃料;而 API 则从传统的服务接口演进为“智 能连接器”,通过动态编排与语义理解,支撑 Agent 间的自主协商与任务分解。此外随着云原生 AI 技术(如多模态大模型、 智能 Agent 原生智能应用架构将成为未来应用的主流形态。支撑上述洞察的核心要素如下: » 3.1.1 大模型能力的突破性提升,为 Agent 提供智能化基座 自然语言理解与生成能力的跃迁:LLM 通过海量数据训练和参数规模的扩大,具备了更强的上下文理解、推理 和生成能力。GPT-4 在自然语言理解及生成能力上的突破,使得 Agent 能够更自然地进行人机交互。如医疗领域的 Agent 可根据患者症状快速生成诊断建议,教育领域的 原生应用技术栈。 数据层:提供多模态数据支持,包括结构化数据(数据库、表格)、非结构化数据(文本、图像)、领域知识(如 科研文献、行业标准)和支持动态更新的外部数据(如专利、新闻)。数据层可为模型层提供训练与推理所需的原始 数据,并通过向量化技术增强 Agent 的上下文理解能力。 模型层:构建智能化基座,涵盖通用大模型与垂直领域模型,实现模型的高效部署与推理。 工具层:将本地可调用命令及外部 API
    20 积分 | 59 页 | 8.39 MB | 4 月前
    3
  • pdf文档 2025年中国智算云服务行业:人工智能时代下IaaS、PaaS、SaaS的产业机遇

    Agent平台”,从直接的产品竞争者转型 为价值整合者与生态赋能者 ◼ 研究背景 随着大模型技术的飞速发展与迭代, 人工智能正驱动全球计算范式发生根 本性变革,传统的CPU云计算架构已难 以满足AI训练与推理带来的海量算力需 求,市场正加速向以GPU为核心的智能 计算演进。在此背景下,云服务产业 的价值链被重塑,IaaS、PaaS、SaaS各 层的业务逻辑、商业模式与竞争要素 均发生了深刻变化。本报告旨在深度 AI搜索:基于大语言模型和自然语言处理构建的新型搜索引擎,具备语义理解和答案生成能力,区别 于传统的链接列表式搜索,代表产品包括秘塔AI、纳米搜索等。 ◆ 大模型(Large Model):由海量数据训练而成的超大参数AI模型,具备强语言理解与生成能力,支 持多种模态交互,是AI搜索与GEO优化的核心基础技术。 ◆ AIGC(人工智能生成内容):通过AI技术高效生成高质量内容,融合专业与用户视角,用于满足AI搜 换流量阶段,不同平台 差异化能力是竞争关键 应用与终端层 行业ISV/终端设备厂商 纯软+软/硬结合 企业私有化部署/定制 Agent服务初现盈利模型 阶段一:算力先行 特征:重建设,重投资,关注训练能 力和AI基础设施建设。目前已完成基 本竞争格局搭建,边际红利递减。 阶段二:模型生态构建 自研/引进大模型,形成 PaaS/MaaS能力平台。目前是智 算产业的发展重点,处于高投入探 索阶段,但未形成普遍商业化。
    20 积分 | 19 页 | 1.03 MB | 14 天前
    3
共 44 条
  • 1
  • 2
  • 3
  • 4
  • 5
前往
页
相关搜索词
全球计算联盟GCC2025异构算力协同白皮皮书白皮书湖南南大大学湖南大学年智算中心光电交换网络全栈技术阿里云百炼安全面向新型智算以太以太网弹性通道FlexLaneAIHR科技秘笈赋能人力资本人力资本智能智能化变革医疗健康模型伦理93WORD场景引入DeepSeek可行研究可行性可行性研究报告144上海科学研究院应用生命周期生命周期中国智算云服务行业服务行业人工人工智能时代IaaSPaaSSaaS产业机遇
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩