北大 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

北大：DeepSeek-R1及类强推理模型开发解读

类强推理模型开发解读陈博远北京大学 2022 级“通班” 主要研究方向：大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline 总览 \ DeepSeek-V3 Base

10 积分 | 76 页 | 6.72 MB | 10 月前
3
北京大学-DeepSeek原理和落地应用2025

DeepSeek原理与落地应用 AI肖睿团队（孙萍、吴寒、周嵘、李娜、张惠军、刘誉） 2025年03月01日厦门大学大数据百家讲坛 • 北大青鸟人工智能研究院 • 北大计算机学院元宇宙技术研究所 • 北大教育学院学习科学实验室 7 人工智能概念辨析 DeepSeek R1 大模型原理落地应用目录 C O N T E N T S 人工智能概念辨析 PART 01

10 积分 | 57 页 | 9.65 MB | 10 月前
3
2025年DeepSeek手册：DeepSeek给我们带来的创业机会

政企、创业者必读 DeepSeek出现之前的十大预判之五知识的质量和密度决定大模型能力  高质量数据、合成数据使模型知识密度的快速增长  大模型能以更少的参数量达到更高的性能  360联合北大研发：5%参数量逼近Deepseek-R1满血性能 18 政企、创业者必读 DeepSeek出现之前的十大预判之六成本越来越低  过去一年，大模型成本「自由落体」  国外：GPT-

10 积分 | 76 页 | 5.02 MB | 10 月前
3

共 3 条前往

页

北大 DeepSeek R1 及类推理模型推理模型开发解读北京大学北京大学原理落地应用 2025 手册我们带来创业机会

分类

语言

格式

北大：DeepSeek-R1及类强推理模型开发解读

北京大学-DeepSeek原理和落地应用2025

2025年DeepSeek手册：DeepSeek给我们带来的创业机会