北大:DeepSeek-R1及类强推理模型开发解读类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline 总览 \ DeepSeek-V3 Base10 积分 | 76 页 | 6.72 MB | 5 月前3
北京大学-DeepSeek原理和落地应用2025DeepSeek原理与落地应用 AI肖睿团队 (孙萍、吴寒、周嵘、李娜、张惠军、刘誉) 2025年03月01日 厦门大学大数据百家讲坛 • 北大青鸟人工智能研究院 • 北大计算机学院元宇宙技术研究所 • 北大教育学院学习科学实验室 7 人工智能概念辨析 DeepSeek R1 大模型原理 落地应用 目 录 C O N T E N T S 人工智能概念辨析 PART 0110 积分 | 57 页 | 9.65 MB | 5 月前3
2025年DeepSeek手册:DeepSeek给我们带来的创业机会政企、创业者必读 DeepSeek出现之前的十大预判 之五 知识的质量和密度决定大模型能力 高质量数据、合成数据使模型知识密度的快速增长 大模型能以更少的参数量达到更高的性能 360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18 政企、创业者必读 DeepSeek出现之前的十大预判 之六 成本越来越低 过去一年,大模型成本「自由落体」 国外:GPT-10 积分 | 76 页 | 5.02 MB | 5 月前3
共 3 条
- 1
