积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(6)技术工具(6)

语言

全部中文(简体)(6)

格式

全部PPT文档 PPT(4)PDF文档 PDF(2)
 
本次搜索耗时 0.015 秒,为您找到相关结果约 6 个.
  • 全部
  • 人工智能
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PPT文档 PPT
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 华为昇腾DeepSeek解决方案

    RL 完成,从而解决 R1-Zero 可读性差、 多种 语言混合问题 本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模 型 ( Qwen/LLaMa 1.5B 7B 14B 32B 70B ) DeepSeek-R1 以 DeepSeek-V3 Base ( 671B )为基础模型, 使 用 GRPO 算法作为 RL 框架来提升 Reasoning 性能 Huawei √ DeepSeek R1-Distill-Qwen-32B - √ DeepSeek R1-Distill-Llama-8B DeepSeek R1-Distill-Qwen-1.5B/7B/14B √ √ 配套版本上线昇腾社区: https://www.hiascend.com/software/modelzo o/models/detail/678bdeb4e1a64c9dae51d35 系统吞吐 4940 Token/s@32B 7500 Token/s@14B 730 Token/s@14B 956 Token/s@8B 956 Token/s@7B 80 路 @14B 115 路 @8B 115 路 @7B 昇腾 DeepSeek 一体机: 大吞吐 + 高并发, 加速行业模型落地 模型参数: 14B/32B DeepSeek-R1-Distill-Qwen-32B
    0 积分 | 32 页 | 2.52 MB | 5 月前
    3
  • ppt文档 山东大学:DeepSeek 应用与部署

    DeepSee k DeepSeek-R1 - Ditill-Qwen-32B DeepSeek-R1 - Ditill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-14B DeepSeek-R1 - Distill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-7B DeepSeek DeepSeek-R1 DeepSeek - R1 蒸馏模型。 • 云原生构建:登录腾讯云 ,云原生构建相关服务 ,一键体验 DeepSeek ,无需等待下载 ,支持 1.5b/7b/8b/14b/32b 多款模型。 • TI 平台:登录腾讯云 TI 平台 ,提供专属算力、多种尺寸模型、 0 代码模型部署等功能。 • HAI :登录腾讯云 HAI 控制台 ,新建 DeepSeek - 再点击左上方搜索图标搜索 deepseek 选择模型。 注意参数规 模 不同 ,性能和硬件需求有差异。 例如 , 1.5B 适合体验尝鲜 , 7B 适合普通创 作及开 发测试 , 8B 适合对内容要求更高的场景 , 14B 适合专业及深度内容创作。 LM Studio+DeepSeek LM Studio 可以通 过 huggaface 下载 Deepseek 各种蒸 馏模型( GGUF ) DeepSeek
    10 积分 | 79 页 | 6.52 MB | 5 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    性能提升 1 高达 2.77 倍 GPU 图像分类推理 性能提升 1 高达 第 12 代 英特尔® 酷睿™ 移动处理器 14 02 英特尔 ® 技术方案 主要特性 性能和效率 • 英特尔® 7 制程工艺 • 多达 14 个核心和 20 个线程,具有高性能混合架构 • Intel® Thread Director6 使您的核心与工作负载相匹配 • 高达 24 (W) P-core E-core P-core E-core 英特尔® vPro® Enterprise B ME16 ME16 英特尔® 酷睿™ i7- 12800HE 处理器 14 6 8 20 24 MB 高达 4.6 高达 3.5 2.4 (@45W) 1.6 (@35W) 1.8 1.35 是 企业 消费者 英特尔 锐炬® X e 显卡 D 96 (@28W) 0.9 2.25 128 2 否 否 英特尔® 酷睿™ Ultra 5 处理器 135H 14 4 8 2 18 18 MB 4.6 3.6 1.7 (@28W) 1.2 2.2 128 2 否 否 英特尔® 酷睿™ Ultra 5 处理器 125H 14 4 8 2 18 18 MB 4.5 3.6 1.2 (@28W) 0.7 2.2 112 2 否 否
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • ppt文档 从智慧教育到智慧课堂:理论、规范与实践

    感知学习者的学习与交往需 求。 外在 情境感知 感知教与学活动实施的物理位 置信息; 感知教与学活动发生、进行与 结束的时间信息; 感知教与学活动场所的环境信 息,如温度、湿度等; 14 无缝连 接 泛在网络是智慧教 育开展的基础,基 于泛在网络的无缝 连接是智慧教育的 基本特征。 15 无缝连接 为特定学习情景建立 学习社群,为学习者 有效联接和利用学习 社群进行沟通和交流
    10 积分 | 74 页 | 10.39 MB | 6 月前
    3
  • pdf文档 2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

    ➢ 调用外部模块构建额外的检测单元; ➢ 甚至可以更进一步,测量执行时间,使训练过程首选性能更高的解决方案; ➢ 以上均可以作为小批量训练 (Mini-Batch) 和连续训练过程中的奖励信号 14 DeepSeek-R1 技术剖析:DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示:举例 - 自动化标记和验证 ➢ 示例输入: 编写 python 代码,该代码采 1.3k 个问题)可以显著提升推理性能,尤其是在数学任务中, 展现了 Long-COT 调优即便在数据量较少的情况下依然具有强大的推理能力。 ➢ 更大规模和专业化模型提升性能:更大规模的模型(如 14B、32B)以及经过专业预训练的模型(如数学预训练和上下文 长度扩展)在 Long-COT 训练中表现更佳,优于较小规模的模型(如 7B)在保持正确推理路径和处理复杂任务的能力。 ➢ 任务与语言之间的正迁移:Long-COT
    10 积分 | 76 页 | 8.39 MB | 6 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    系列大模型正在对接学校统一身份认证平台 ,近期将面向全校师生开放试用 同时 , 将根据学校各学科具体需求与硬件条件 , 以具体化、 针对性、 私有化、 学科专用或实验室专用的方式将进一 步 将 70B 、 32B 、 14B 、 8B 、 7B 等不同版本的 DeepSeek-R1 大模型部署到学科内部 ,并接入本地知识库(如 学术资源、 课程资源、 实验数据等) , 后期学校将根据具体需求及资源占用情况提供差异化服务 支持在 24G 显存( 4090D ) 的设备上本地运行 DeepSeek- R1 、 V3 的 671B 满血版。 其预处理速度最高可达 286 tokens/s ,推理生成速度最高能达 到 14 tokens/s 。 甚至有开发者借助这一优化技术 ,在 3090 显卡和 200GB 内存的配置下 ,使 Q2_K_XL 模型的推理速度达到 9.1 tokens/s , 实现了千亿级模型的 “家庭化”
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
共 6 条
  • 1
前往
页
相关搜索词
华为DeepSeek解决方案解决方案山东东大大学山东大学应用部署英特特尔英特尔工业人工智能人工智能白皮皮书白皮书2025年版智慧教育课堂理论规范实践R1Kimi1.5及类推理模型推理模型开发解读报告赋能高校教学科研
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩