有效 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

时代下的RL新范式：后训练扩展律 Post-Training Scaling Law ➢ DS-R1 独立发现了一些通往o1路上的核心理念，并且效果还好到受到了OpenAI 的认可 ➢ 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力？ ➢ 得益于纯大规模强化学习，DeepSeek-R1 具备强大推理能力与长文本思考能力，继开源来备受关注。 GRPO核心思想是通过构建多个模型输出的群组，并计算群组内的相对奖励来估计基线，从而避免了传统策略优化算法中需要使用与策略模型大小相同的评论模型。 ➢ 大幅度降低 RL 训练的计算成本，同时还能保证模型能够有效地学习到策略。 ➢ 具体来说，在传统的 RL 训练中，评论模型需要与策略模型具有相同的大小，增加计算资源的消耗。而 GRPO 算法利用群组内的相对信息来估计基线，避免了使用Critic Model的需要。。 ➢ 为了充分释放 GRPO 的潜力并确保训练稳定性，DeepSeek R1 的训练中采用了四阶段的交替迭代流程：“监督微调（SFT）→ 强化学习（RL）→ 再次 SFT → 再次 RL”，有效解决了传统强化学习模型在冷启动、收敛效率和多场景适应性方面的瓶颈。 ➢ 强大的自验证和长链推理能力：并非预先设定好的，而是在RL训练中自主涌现出来的 ➢ 自验证是指模型在生成最终答案之前，会先

10 积分 | 76 页 | 8.39 MB | 1 年前
3
从智慧教育到智慧课堂：理论、规范与实践

息，如温度、湿度等； 14 无缝连接泛在网络是智慧教育开展的基础，基于泛在网络的无缝连接是智慧教育的基本特征。 15 无缝连接为特定学习情景建立学习社群，为学习者有效联接和利用学习社群进行沟通和交流提供支持无缝切换无缝切换联接社群系统集成虚实融合多终端访问系统集成遵循技术标准，跨级、跨域教育服务平台之间实现数据共享、系统集成操作系统、多点触控显示器 1. 构建新技术支持的全新教学环境终端： IPAD 学习环境学习环境： STEAM 学习实验室 STEM 学习实验室2 充分激活学生潜能与创意，促进数字技术和个人制造的有效融合，让学生有更多的实践动手的机会，我们高标准建设“ STEM 创新学习实验室” ，让学生在实践操作中开展创客式学习，培养学生创新能力。  S 学习实验室（科学 Science ） 

10 积分 | 74 页 | 10.39 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

参数规模大。大模型通常包含数千万、数亿甚至更多参数；巨大的参数规模使大模型能够处理更加复杂和多样的任务。 3. 强大的泛化能力。大模型通过在大规模数据集上进行训练，学习到了丰富的知识和特征表示，从而具有强大的泛化能力，能够有效处理多种从未见过的数据或新任务，甚至能处理一些与训练数据截然不同的任务。这使得大模型能应用于多种任务和场景，具有广泛的适用性。 4. 灵活性和可定制性。大模型通常具有灵活的架构和可定制的参数，速度快。很多产品缺陷种类复杂、缺陷细小、区分度低，传统的人工检测和机器视觉方案，检出率低，速度慢，无法满足生产质量和高速产线的节拍要求。AI 技术与机器视觉检测方案相结合，为这类难检缺陷提供有效解决方案。以手机玻璃盖板为例，手机玻璃盖板在生产过程中可能会出现划痕、蹭伤、崩边、气泡、手指纹、水迹、水印等多种微小且不易察觉的缺陷，缺陷种类最多可达 30 多种。必须精准、高效地检出这些缺陷以保证产品质量，检测精的，特别是在涉及用户数据隐私保护或新生产线快速部署的场景中。为了解决这一问题，零样本或少样本异常检测 (ZSAD or FSAD) 目标是在没有或仅有极少量目标类别样本的情况下，依然能够有效地执行异常检测任务。这要求模型具备一定的泛化能力，能够在没有先验知识的情况下识别未知的异常类型。具体来说，可以通过将产品的正常特征与异常特征用自然语言描述，并将这些描述与产品图像相结合，来训练模型。在预训

0 积分 | 82 页 | 5.13 MB | 1 年前
3
华为昇腾DeepSeek解决方案

算子库低阶二进制算子库高阶融合算子库硬件层算网协同提升有效吞吐 NLSB 网络级负载均衡实现网络动态路由，有效吞吐达 98% 控制器全局集中算路自动生成路径并动态下发网络获取网络拓扑网络局部计算选路 Hash 冲突导致有效

0 积分 | 32 页 | 2.52 MB | 1 年前
3
DeepSeek大模型赋能高校教学和科研2025

ChatGPT-4o 、 Gemini Advanced 和 DeepSeek 三种 AI 模型，评估了它们向非医学背景公众传达欧洲复苏委员会（ ERC ）指南的有效性。意大利的一个研究团队借助 DeepSeek 模型，在中科院 1 区、影响因子 6.5 分的《 Resuscitation 》期刊上发表了一篇 Letter

10 积分 | 123 页 | 15.88 MB | 1 年前
3

共 5 条前往

页

分类

语言

格式

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

从智慧教育到智慧课堂：理论、规范与实践

英特尔-工业人工智能白皮书2025年版

华为昇腾DeepSeek解决方案

DeepSeek大模型赋能高校教学和科研2025