14 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

华为昇腾DeepSeek解决方案

RL 完成，从而解决 R1-Zero 可读性差、多种语言混合问题本次开源同时发布了 6 个基于 DeepSeek-R1 蒸馏的更小稠密模型（ Qwen/LLaMa 1.5B 7B 14B 32B 70B ） DeepSeek-R1 以 DeepSeek-V3 Base （ 671B ）为基础模型，使用 GRPO 算法作为 RL 框架来提升 Reasoning 性能 Huawei √ DeepSeek R1-Distill-Qwen-32B - √ DeepSeek R1-Distill-Llama-8B DeepSeek R1-Distill-Qwen-1.5B/7B/14B √ √ 配套版本上线昇腾社区： https://www.hiascend.com/software/modelzo o/models/detail/678bdeb4e1a64c9dae51d35 系统吞吐 4940 Token/s@32B 7500 Token/s@14B 730 Token/s@14B 956 Token/s@8B 956 Token/s@7B 80 路 @14B 115 路 @8B 115 路 @7B 昇腾 DeepSeek 一体机：大吞吐 + 高并发，加速行业模型落地模型参数： 14B/32B DeepSeek-R1-Distill-Qwen-32B

0 积分 | 32 页 | 2.52 MB | 10 月前
3
山东大学：DeepSeek 应用与部署

DeepSee k DeepSeek-R1 - Ditill-Qwen-32B DeepSeek-R1 - Ditill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-14B DeepSeek-R1 - Distill-Ollama-7B DeepSeek-R1 - Ditill-Qwen-7B DeepSeek DeepSeek-R1 DeepSeek - R1 蒸馏模型。 • 云原生构建：登录腾讯云，云原生构建相关服务，一键体验 DeepSeek ，无需等待下载，支持 1.5b/7b/8b/14b/32b 多款模型。 • TI 平台：登录腾讯云 TI 平台，提供专属算力、多种尺寸模型、 0 代码模型部署等功能。 • HAI ：登录腾讯云 HAI 控制台，新建 DeepSeek - 再点击左上方搜索图标搜索 deepseek 选择模型。注意参数规模不同，性能和硬件需求有差异。例如， 1.5B 适合体验尝鲜， 7B 适合普通创作及开发测试， 8B 适合对内容要求更高的场景， 14B 适合专业及深度内容创作。 LM Studio+DeepSeek LM Studio 可以通过 huggaface 下载 Deepseek 各种蒸馏模型（ GGUF ） DeepSeek

10 积分 | 79 页 | 6.52 MB | 10 月前
3
英特尔-工业人工智能白皮书2025年版

性能提升 1 高达 2.77 倍 GPU 图像分类推理性能提升 1 高达第 12 代英特尔® 酷睿™ 移动处理器 14 02 英特尔 ® 技术方案主要特性性能和效率 • 英特尔® 7 制程工艺 • 多达 14 个核心和 20 个线程，具有高性能混合架构 • Intel® Thread Director6 使您的核心与工作负载相匹配 • 高达 24 (W) P-core E-core P-core E-core 英特尔® vPro® Enterprise B ME16 ME16 英特尔® 酷睿™ i7- 12800HE 处理器 14 6 8 20 24 MB 高达 4.6 高达 3.5 2.4 (@45W) 1.6 (@35W) 1.8 1.35 是企业消费者英特尔锐炬® X e 显卡 D 96 (@28W) 0.9 2.25 128 2 否否英特尔® 酷睿™ Ultra 5 处理器 135H 14 4 8 2 18 18 MB 4.6 3.6 1.7 (@28W) 1.2 2.2 128 2 否否英特尔® 酷睿™ Ultra 5 处理器 125H 14 4 8 2 18 18 MB 4.5 3.6 1.2 (@28W) 0.7 2.2 112 2 否否

0 积分 | 82 页 | 5.13 MB | 10 月前
3
从智慧教育到智慧课堂：理论、规范与实践

感知学习者的学习与交往需求。外在情境感知 感知教与学活动实施的物理位置信息； 感知教与学活动发生、进行与结束的时间信息； 感知教与学活动场所的环境信息，如温度、湿度等； 14 无缝连接泛在网络是智慧教育开展的基础，基于泛在网络的无缝连接是智慧教育的基本特征。 15 无缝连接为特定学习情景建立学习社群，为学习者有效联接和利用学习社群进行沟通和交流

10 积分 | 74 页 | 10.39 MB | 10 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

➢ 调用外部模块构建额外的检测单元； ➢ 甚至可以更进一步，测量执行时间，使训练过程首选性能更高的解决方案； ➢ 以上均可以作为小批量训练 (Mini-Batch) 和连续训练过程中的奖励信号 14 DeepSeek-R1 技术剖析：DeepSeek-R1 Zero DeepSeek-R1 Zero的关键启示：举例 - 自动化标记和验证 ➢ 示例输入: 编写 python 代码，该代码采 1.3k 个问题）可以显著提升推理性能，尤其是在数学任务中，展现了 Long-COT 调优即便在数据量较少的情况下依然具有强大的推理能力。 ➢ 更大规模和专业化模型提升性能：更大规模的模型（如 14B、32B）以及经过专业预训练的模型（如数学预训练和上下文长度扩展）在 Long-COT 训练中表现更佳，优于较小规模的模型（如 7B）在保持正确推理路径和处理复杂任务的能力。 ➢ 任务与语言之间的正迁移：Long-COT

10 积分 | 76 页 | 8.39 MB | 10 月前
3
DeepSeek大模型赋能高校教学和科研2025

系列大模型正在对接学校统一身份认证平台，近期将面向全校师生开放试用同时，将根据学校各学科具体需求与硬件条件，以具体化、针对性、私有化、学科专用或实验室专用的方式将进一步将 70B 、 32B 、 14B 、 8B 、 7B 等不同版本的 DeepSeek-R1 大模型部署到学科内部，并接入本地知识库（如学术资源、课程资源、实验数据等），后期学校将根据具体需求及资源占用情况提供差异化服务支持在 24G 显存（ 4090D ）的设备上本地运行 DeepSeek- R1 、 V3 的 671B 满血版。其预处理速度最高可达 286 tokens/s ，推理生成速度最高能达到 14 tokens/s 。甚至有开发者借助这一优化技术，在 3090 显卡和 200GB 内存的配置下，使 Q2_K_XL 模型的推理速度达到 9.1 tokens/s ，实现了千亿级模型的 “家庭化”

10 积分 | 123 页 | 15.88 MB | 10 月前
3

共 6 条前往

页

分类

语言

格式

华为昇腾DeepSeek解决方案

山东大学：DeepSeek 应用与部署

英特尔-工业人工智能白皮书2025年版

从智慧教育到智慧课堂：理论、规范与实践

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

DeepSeek大模型赋能高校教学和科研2025