积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(4)技术工具(4)

语言

全部中文(简体)(4)

格式

全部PDF文档 PDF(2)PPT文档 PPT(2)
 
本次搜索耗时 0.061 秒,为您找到相关结果约 4 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    的资金、技术、人才的垄断,全球 重新思考中美技术路线的选择 泛化性和经济性大幅提升 LLM 进入“ CV Resnet 时刻” 补齐最后一块自主创新的版图 真正形成中美两条 AI 技术路 线 AI 框架:昇思、飞桨 … 异构计算架构: CANN … 互联技术:灵衢 AI 芯片:昇腾、寒武纪 … DeepSeek-R1 进一步验证“算力即性能” Scaling Law 系统吞吐 4940 Token/s@32B 7500 Token/s@14B 730 Token/s@14B 956 Token/s@8B 956 Token/s@7B 80 路 @14B 115 路 @8B 115 路 @7B 昇腾 DeepSeek 一体机: 大吞吐 + 高并发, 加速行业模型落地 模型参数: 14B/32B DeepSeek-R1-Distill-Qwen-32B 移 动、 电 信一 体 机 247 路 @32B 300 路 @14B 思 腾合 力 珑 京科 技 思 腾合 力 珑 京科 技 珑 京科 技 思 腾合 力 潞 晨科 技 思 腾合 力 珑 京科 技 1911 Token/s 系统吞吐 并发路数 并发路数 并发路数 并发路数 165 路 192 路 16 路 13 … 模型集合 模型名称 参数 计算精度 产品
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    的机密虚拟机中,客户机操作系统和虚拟机应用程序被隔离开来,无法被云端主机、虚拟机 管理程序和平台的其他虚拟机访问。 24 02 英特尔 ® 技术方案 亮点技术 AI 计算能力 • 单路英特尔® 至强® 6 性能核处理器拥有多达 128 个内核, 实现了更高密度计算性能和可扩展性。 • 对于基于 BF16 和 FP16 的模型,英特尔® AMX 的乘法累 加 (MAC) 运算速度比英特尔® 超级通道互联(Intel® Ultra Path Interconnect, 英特尔® UPI)2.0 的跨插槽内带宽速度高达 24 GT/s, 与上一代产品相比提升高达 20%。 • 双路服务器拥有多达 178 条 PCIe Gen 5 通道,单路服务 器则多达 136 条,可以支持重要的 I/O 附加组件,包括加 速器、网络适配器、存储控制器和存储。 • 多达 64 条 Compute Express Link 500W • 单路或双路服务器 • 12 条内存通道 • 高达 6,400 MT/s DDR5 • 8,800 MT/s MCR DIMM • 多达 96 条 PCle 5.0 通道 • 6 条英特尔® UPI 2.0 链路 即将推出 • 每个 CPU 拥有多达 86 个内核(172 个线程) • 每个 CPU 高达 350 W • 单路、双路、四路或八路服务器 • 8 条内存通道
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    开创RL加持下强推理慢思考范式新边界 ➢ OpenAI o1 开启后训练 Post-Training 时代下的RL新范式:后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念,并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? ➢ 得益于纯大规模强化学习,DeepSeek-R1 精细化编排计算和通信 ➢ 控制前向和反向过程中 计算和通信的GPU SM 数量,保证计算和通信 完全重叠 ➢ 双向流水线并行 ➢ 降低流水线的Bubble ➢ 需要存两份模型参数 ➢ 64路的专家并行 [1] DeepSeek-V3 技术报告 https://arxiv.org/pdf/2412.19437v1 双向流水线并行 计算和通信重叠 气泡和内存分析 72 拓展分析: System
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    理论或数据。 其产生原因主要包括: 模型训练数据存在偏差、 不完整或错误 , 导致在学习过程中引入了不准 确 的信息; 模型基于概率分布生成内容 , 在某 些情 况下会选择一些看似合理但实际错误的路 径。 大 模型幻觉会影响信息的准确性和可靠性 , 在信息 传播、 学术研究等领域可能带来不良影响。 因此, 在使用大模型时 , 需要对其输出内容进 行仔细验 证和甄别。 3.6.3 主流大模型“幻觉”评测
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
共 4 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案英特特尔英特尔工业人工智能人工智能白皮皮书白皮书2025年版R1Kimi1.5及类推理模型推理模型开发解读报告赋能高校教学科研
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩