积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PDF文档 PDF(3)PPT文档 PPT(3)
 
本次搜索耗时 0.012 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    ................................................................29 2.2.1 英特尔® oneAPI 工具包 — 跨架构性能加速 .................................................................................29 2.2.2 OpenVINO™ 的设备维护解决方案 .........................................................................................58 合作伙伴加速项目和产品推荐 ................................................. 60 4.1 AI 硬件产品推荐 ..................... 过程的优化和智能化,最终帮助企业提高生产效率、降低成本、提升产品质量,实现数字化转型。 2023 年 12 月,由信通院牵头、多家单位联合编制的《工业大模型技术应用与发展报告》指出,AI 与大模型将加速赋能新型 工业化,预计从 2022 年至 2032 年,工业 AI 市场规模将以 46% 的年均复合增长率高速成长。 相较于发达国家,中国制造企业的 AI 应用率相对较低,大约在 11% 左右。Gartner
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 华为昇腾DeepSeek解决方案

    DeepSeek 提供了一种高效率训练的方法,同等 算力规模可以探索更强的模型能力 • 在竞争背景下,头部玩家仍将追逐 Scaling Law ,坚定 AI 算力的战略投资,加速探索下一代 AI 技术 DeepSeek 是 AI 发展史上的一个关键里程碑,但远未达到 AI 终点 AI 模型算法: GPT 、 LLaMA AI 框架: PY 、 TF 异构计算架构: GRPO :群体进化的智慧筛选器 自我验证机制: AI 的 " 错题本系 统 " 混合专家模型的 " 智能路由器“ 多头潜在注意力 MLA :空间压缩术 训练框架加速: 16 到 3 的量化压 缩, 通信降低 89% 推理加速:预加载,动态批处理等 模型、数据、工具链、部署全开源 蒸馏技术使能第三方模型性能 DeepSeek V3 :实现极致性能,稀疏 MOE 提质 降本 技术创新 可参考投机采样改造 MTP 模块 ,加速推理效率 MTP : Multi-Token Prediction 多 token 预测提升模 型效果 • MTP 模块仅在训练中使用,提升模型训练效果,推理阶段可以不使用 MTP 模块,基础模型能够独立完成正常推 理 • 参考投机采样, MTP 模块也可以被重新配置用于 speculative decoding ,加速解码过程,降低整体时延 7
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    ■ PC 时代:一个应用只需一台电脑,算力够 ■ 云计算时代:应用需要超过一台机器的算力,算力基本够 ■ 人工智能时代:算力开始不足,需大量高性能 Al 加速器 计算机算力的发展 人工智能大模型算力估计 ■ 人工智能大模型算力估计 ■ 1, 数据量 ( D ) >15* 模型参数量 ( N ) ■ 万亿模型 (N )=1000*109=1012 可行性分析:美国可以发禁令 美国政府对我国的禁令 现成成熟算力: 2023 年禁止出口高端 Al 芯片 ■ A100 、 H00 、 H800 、 A800 等数据中心 GPU ■ 运力: 2022 年限制 Al 加速器的互联带宽 算力: 2024 年禁止台积电代工 7nm 工艺的国内芯 片 存力: 2024 年禁止 HBM 芯片 光刻机: 2024 年限制荷兰 ASML 出口 7nm 光刻机到 中国
    10 积分 | 23 页 | 7.53 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    能否在Zero基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 R1; ➢ 能否利用一些高质量反思数据集做 Cold Start 从而加速RL的收敛或帮助提升推理表现 16 DeepSeek-R1 技术 Pipeline 总览 DeepSeek-v3-Base (671B) DeepSeek-R1-Zero 推理为中心的大规模强化学习 computation increasing) ➢ DeepSeek-R1-Zero 自主涌现学会重新评测原来的方法、反思和主动探索其他的路径 ➢ 多阶段训练下的冷启动让RL训练更加稳定,避免初期不稳定、加速收敛、提升思维链可读性 ➢ 未来后训练的重心会逐步倾向于RL,但是少量训练用于SFT可能还是必须的 ➢ 强化学习技术不只局限在基于规则的数学、算法代码等容易提供奖励的领域,它还可以创造性 地把 些需要跨越多个逻辑步骤才能找到答案的问题至关重要,例如复杂的数学题或逻辑谜题。 ➢ 冷启动让RL训练更加稳定: ➢ 避免 RL 训练初期的不稳定,使得模型能够更快地进入稳定的训练状态; ➢ 有效地加速 RL 训练的收敛,缩短训练时间; ➢ 提高模型输出的可读性,减少不同语言混合使用的情况。 26 DeepSeek-R1 Takeaways 总结 Part II ➢ 推理为中心的RL训练: ➢
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    硬件环境准 备 DeepSeek 本地部署 - 部署办法 方法 1 :使用 Hugging Face Transformers 方法 2 :使用 vLLM 加速推 理 方法 3 : Docker 部 署 Anything LLM 接入 • 下载安装 • 打开官网 ,根据自己的系统选择下载对应的版本。 • • 安装文件 ,按照安装向导的提示进行操作
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    流路径规 划) ⚫ 超导量子比特:训练速度提升 1000 倍,模型参数突破百万亿级 应用场景: ⚫ 1 小时优化全国高铁时刻表,减少 30%能源消耗 ⚫ 破解蛋白质折叠难题,加速癌症药物研发 ②多模态深度对齐 ⚫ 跨模态理解:通过神经符号系统实现图文音统一编码(如从建筑设计图生成施工 解说视频) ⚫ 具身智能:2026 年机器人将具备“触觉-视觉-力学”联觉(如凭触感判断水果成熟
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
英特特尔英特尔工业人工智能人工智能白皮皮书白皮书2025年版华为DeepSeek解决方案解决方案浙江大学浙江大学模型优势算力成本角度解读R1Kimi1.5及类推理推理模型开发报告山东东大山东大学应用部署AI跃迁基础完全指南
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩