积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PDF文档 PDF(3)PPT文档 PPT(3)
 
本次搜索耗时 0.018 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模 型 ( Qwen/LLaMa 1.5B 7B 14B 32B 70B ) DeepSeek-R1 以 DeepSeek-V3 Base ( 671B )为基础模型, 使 用 GRPO 算法作为 RL 框架来提升 Reasoning 性能 Huawei Proprietary 数值精度 计算与通信极致掩盖 减少 50%PP 气泡 以计算换内存、降通信,空间时间双优化 压缩 KVCache 降低内存 90% 支持更高并发 模型容量提升 3 倍 计算量减少 70% DeepSeek 通过从模型结构到训推全流程的优化,带来大模型新 范式 DeepSeekV3/R1 ,大幅提升从训练到推理的计算效率,降低模型创新及应用落地的门槛 降低学习复杂度 简化强化学习流程 175B . Huawei Proprietary - Restricted Distribution PalM(540B) . Groq4 Hunyuan Claude 2 Llama3-70B Baichuan2-13B 训练算力需求 ( PFLOPS ) Megatron-Tuning NLG 530B Doubao 2.0 Gemini 2.0 GLM-130B AlexNet
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    • 硅基流动: 注册即送 2000 万 Tokens ,提供多个基于 DeepSeek - R1 蒸馏训练的模型 ,如 DeepSeek - R1 - Distill - Llama - 70B 等 ,在推理能力上表现出色。 • 阿里云百炼: 提供多个 DeepSeek 系列模型 ,如 DeepSeek - V3 、 DeepSeek - R1 - Distill - Qwen - NVIDIA 显卡( RTX 3090/4090/A100 等) 显存要求: ■ 7B 模型: 至少 16GB 显存 ■ 13B/20B 模型: 至少 24GB 显存 ■ 70B 模型: 需多卡并行(如 2xA100 ) 支持 CUDA 11.7+ 和 cuDNN 8.5+ 2. 系统要求 Linux ( Ubuntu 20.04+ ) 或
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • pdf文档 AI跃迁派:2025年DeepSeek零基础完全指南

    4.技术普惠:AI 民主化的中国方案 DeepSeek 通过两大创新让 AI 技术“飞入寻常百姓家”: 1.开源开放:代码和模型权重全部公开,学生也能用个人电脑跑 AI 2.知识蒸馏:把 70B 参数大模型压缩到 1.5B,手机都能运行专业级 AI 5.国际影响:技术出海的东方智慧 ⚫ 在东南亚、中东等地区,DeepSeek 成为数智主权建设工具,帮助发展中国家摆脱 对西方技术的依赖 AI 联合作战 指令模板: “先让 DeepSeekR1 制定《智能手环市场调研方案》,再用 GPT-4 生成问卷文案,最后 用 Claude 整理数据图表” 效率提升:全流程时间缩短 70% ③批判性训练 ⚫ 逆向推演:“假设我的奶茶店三个月后倒闭,请逆向分析失败原因链” ⚫ 跨界迁移:“参考迪士尼排队管理策略,优化咖啡店高峰时段服务流程” 5.官方推荐模板(简化版)
    10 积分 | 21 页 | 1.01 MB | 6 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    (Mixture of Expert) 架构 ➢ MLA:通过引入潜在空间来提高计算效率,同时保持了模型对输入数据的复杂关系的捕捉能力 ➢ MoE: 注于通过高效的专家分配和计算资源利用来降低成本 70 拓展分析: DeepSeek-V3 ➢ FP8混合精度训练 + 多Token预测 ➢ 把主要计算量、比较大的核 心矩阵乘法都用FP8去计算。 ➢ 多Token预测允许模型一次预 测多个Token,从而提高了模
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    系列大模型正在对接学校统一身份认证平台 ,近期将面向全校师生开放试用 同时 , 将根据学校各学科具体需求与硬件条件 , 以具体化、 针对性、 私有化、 学科专用或实验室专用的方式将进一 步 将 70B 、 32B 、 14B 、 8B 、 7B 等不同版本的 DeepSeek-R1 大模型部署到学科内部 ,并接入本地知识库(如 学术资源、 课程资源、 实验数据等) , 后期学校将根据具体需求及资源占用情况提供差异化服务
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    机器视觉/运动控制/机器人/新能源专区 69 04 合作伙伴加速项目和产品推荐 4.3 PIPC 机器视觉产品推荐 阿普奇 信步科技 康士达 卓信创驰 诺达佳 * 排序依照公司英文首字母排序 70 04 合作伙伴加速项目和产品推荐 阿普奇成立于 2009 年,总部位于苏州,专注于工业 AI 边缘计算领域。公司提供多种 IPC 产品,包括传统工业电 脑、一体机、显示器、主板和控制器。阿普奇同时开发了
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案山东东大大学山东大学应用部署AI跃迁2025基础完全指南R1Kimi1.5及类推理模型推理模型开发解读报告赋能高校教学科研英特特尔英特尔工业人工智能人工智能白皮皮书白皮书年版
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩