浙江大学-DeepSeek模型优势:算力、成本角度解读2025OOO0 … … OOOO Input Hidden ut ■ 核心技术 DeepSeekMoE: 显者减少计算量 ( 穷则战术穿插 ) ■ 针对美国的算力禁令 ■ 核心思想: 1 共享专家 +256 路由专家,激活 8 个路由专家 ■ 共享专家: 捕获通用知识、降低知识冗余 ■ 路由专家: 量大、细粒度、灵活组合、方便知识表达 ■ 结果:每个 Token 只要过10 积分 | 23 页 | 7.53 MB | 5 月前3
DeepSeek大模型赋能高校教学和科研2025”。这个问题激发了人们 无尽的想象 , 同时也奠定了人工智能的基本概念和雏形 在这篇论文中 ,图灵提出了鉴别 机 器是否具有智能的方法 ,这就是 人 工智能领域著名的“图灵测试”。 如图所示 ,其基本思想是测试者 在 与被测试者(一个人和一台机 器) 隔离的情况下 ,通过一些装 置(如 键盘)向被测试者随意提 问。进行 多次测试后 ,如果被测 试者机器让 平均每个测试者做出 超过 30% 本地知识库 RAG ( Retrieval-Augmented Generation ) , 即检索增强生成 ,是一种结合检索技术和生成模型的技术框 架, 旨在提升模型生成内容的准确性和相关性 其核心思想是: 在生成答案前 , 先从外部知识库中检索相关信息 , 再将检索结果与用户输入结合 ,指导生成模 型 输出更可靠的回答。 简单地说 ,就是利用已有的文档、 内部知识生成向量知识库 ,在提问的时候结合库的内 是人工智能进入全新发展时期的重要标志 ,其核心技术包括生成对抗网 络( GAN , Generative Adversarial Networks )、大型预训练模型、多模 态 技术等 n AIGC 的核心思想是利用人工智能算法生成具有一定创意和质量的内容。通过 训练模型和大量数据的学习 , AIGC 可以根据输入的条件或指导 ,生成与之 相 关的内容。例如 ,通过输入关键词、描述或样本 , AIGC10 积分 | 123 页 | 15.88 MB | 6 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告DeepSeek-R1 长度泛化复现:https://zhuanlan.zhihu.com/p/21290410831 22 DeepSeek-R1 技术剖析:GRPO 赋能RL-Scale ➢ GRPO核心思想是通过构建多个模型输出的群组,并计算群组内的相对奖励来估计基线,从而避免 了传统策略优化算法中需要使用与策略模型大小相同的评论模型。 ➢ 大幅度降低 RL 训练的计算成本,同时还能保证模型能够有效地学习到策略。 K1.5 Main Result Kimi K1.5 Long2Short Result K1.5 专注于用长文本CoT 解决推理时Scaling问题 ➢ 利用 RL 探索:Kimi k1.5 的核心思想是利用强化学习,让模型通过试错(探索)来学习解决问题的能 力,而不是仅仅依赖于静态数据集。 ➢ 长文本 CoT 的 RL:将 RL 应用于长文本CoT推理过程,使模型能够进行更深入、更复杂的推理。10 积分 | 76 页 | 8.39 MB | 6 月前3
共 3 条
- 1
