积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PPT文档 PPT(4)PDF文档 PDF(2)
 
本次搜索耗时 0.012 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    671B )为基础模型, 使 用 GRPO 算法作为 RL 框架来提升 Reasoning 性能 Huawei Proprietary - Restricted Distribution 5 张量低秩压缩以降低 KV Cache 资源开销:相比于传统 MHA , MLA 通过降 维 操作使得存储的张量维度大幅减小。(下图中仅红色阴影部分需要存 储) (bs, ℎ) (bs, ℎ) 2bsℎ Key-Value pair 进行低秩压缩; 2 )使 用 RoPE 获得位置信息; 3 )使用 MHA 计算得到输出。 对 6DeepSH wkevi r而 opr言 iet ryn- s ri t d, DM istriLb ti可 o n 以 将 K V C a c h e 降 低 为 = 1 . 7 需要裁判模型评估 1 次 1token 预测 MHA/GQA 分组共享减少缓存 GPT4 16 专家选 2 FP8 混合精度 双向流水并行 新老策略组队评估 1 次多 Token 预 测 MLA 低秩压缩减少缓存 DeepSeekMoE 更稀疏 256 选 8+1 训练精度 PP 并行算法 强化学习 Attention MOE Token 预测 业界 LLM 大模 型 核心 收益效果
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 浙江大学-DeepSeek模型优势:算力、成本角度解读2025

    (GPT-3:175B 、 GPT-4:1.76T?) ■ 每个 token 激 活 3 7B 参数 (~5.5%), 降低计算 量 MoE: 1 共享专家 + 256 路由专家 MLA: 低秩压缩 DeepSeek v3 模型参 数 L=61 层 oo oouatence9 Input Hiden heOOOO ka 派 {vb k 回 apply RoPE 2024 核心技术 DeepSeekMoE: 显著减少计算 量 DeepSeek 为代表的国内大模型咬住国外最先进大模型 ■ 模型性能:不要指望全面优势, “城头变幻大王旗” ■ 成本:低 ( 战术穿插 ) ■ 算力受限,近几年咬住会更难 ( 大家宽容些 ) ■ 突破工艺卡脖子,实现“战术穿插” +“ 火力覆盖” ■ 中芯国际等硬核大厂突破工艺卡脖子 ■ 华为等算力公司提供高算力密度
    10 积分 | 23 页 | 7.53 MB | 5 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    DeepSeek : 推理模型 | 推理能力 蒸馏 DeepSeek 蒸馏模 型 学生模型 小模型:相当于一枚小学生 ,知识面非常有限 ,但是胜在 没 教授那么大谱 ,给个板凳坐着就够了(部署成本低 ,推 理成 本低)。 老师模型和学生模型 大模型:像一位见多识广、知识储备庞大的“大教 授” ,无所不知 ,但是“供养”他很贵。 什么是模型蒸馏? “ 模型蒸馏”就是把大模型学到的本领,
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    质量检测 加速产品 的更新 换代 智能化 功能增强 消费电子产品对品质要求极高,过检指标和漏检指标严格,且产线速度快。很多产品缺陷种类复杂、缺陷细小、区 分度低,传统的人工检测和机器视觉方案,检出率低,速度慢,无法满足生产质量和高速产线的节拍要求。AI 技术 与机器视觉检测方案相结合,为这类难检缺陷提供有效解决方案。 以手机玻璃盖板为例,手机玻璃盖板在生产过程中可能会出现划 多种。必须精准、高效地检出这些缺陷以保证产品质量,检测精 度一般要求达到 10μm,检测节拍根据盖板尺寸大小通常在 6 秒到 1 秒/件之间,甚至更快。 传统的人眼检测,不但无法达到微小缺陷的检测精度要求,而且人眼容易疲劳,存在效率低、误检漏检偏高等问题, 无法满足生产的精度和节拍要求。将深度学习算法与高精度成像系统相结合,更快速地识别出产品图像中的缺陷及 种类,满足生产线对检测精度和速度的要求。 锂电池的质量直接关乎电动车 Neural Accelerator(英特尔® GNA)3.5 可用于改善音频 降噪和语音识别。 提升图形密集型应用性能,无需入门级独立 GPU 为自助服务终端、终端以及细节丰富的界面整合系统并降 低硬件成本。英特尔® 酷睿™ Ultra 处理器配备内置英特尔 锐炫™ GPU 3,提供多达 8 个 X e 内核(多达 128 个图形执 行单元),有助于减少对入门级独立 GPU 的需求。这一代
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    co/p/the-illustrated-deepseek-r1 15 DeepSeek-R1 技术 Pipeline 总览 ➢ DeepSeek-R1 Zero 的问题:长推理过程可读性差、语言混合,帮助性低 ➢ Research Questions: ➢ 能否在Zero基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT 并且展现出通用能力的模型 入,持续重塑行业竞争格局。 ➢ 资源优化:随着模型使用方案的平民化,中小企业和个人开发者得以将有限资源聚焦于 场景创新与技术优化,无需在基础能力建设或算力消耗上投入过多成本。 ➢ 市场激活:这种高性价比、低门槛的大模型服务模式,将吸引更多初创团队涌入赛道, 催生多元化的应用场景和技术路径,推动行业生态的繁荣发展。 ➢高效创新:在有限算力资源支持下,算法创新模式,突破了算力的“卡脖子”限制 28 技术对比讨论:Kimi 不同模态下,模态特有与模态共有的信息如何统一在偏好建模中? 出发点:我们如何在全模态场景中,实现any-to-any models与人类意图对齐 51 ➢ 针对RLHF/DPO对齐方案存在的效率低、迭代慢、优化难的难题,提出从语言反馈中学习 (Learning from Language Feedback),解决任意到任意模态对齐微调。 Question: What medium is
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 从智慧教育到智慧课堂:理论、规范与实践

     指在传统教室基础上,改进优化教室的物理环境,增添适量数字 化设备,初步实现传统教室的数字化、多功能化的一种未来教室 类型。  优势  环境简易变革,实现教学理念及方式大幅改进  低投入,高产出  使用简单,师生能够快速适应新环境  小步子逐步实施,保证教育生态平衡发展 互动型未来教室  构建基于一对一的教学环境,学习者能够有序开展小组合作 学习、项目学习等多样互动的学习方式。教师可基于教学环
    10 积分 | 74 页 | 10.39 MB | 6 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案浙江大学浙江大学模型优势算力成本角度解读2025山东东大山东大学应用部署英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版R1Kimi1.5及类推理推理模型开发报告智慧教育课堂理论规范实践
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩