DeepSeek大模型赋能高校教学和科研2025大模型的分 类 通用大模型 L0 是指可以在多个领域和任务上通用 的大模型 。 它们利用大算力、使 用 海量的开放数据与具有巨量参 数的 深度学习算法,在大规模无 标注数 据上进行训练, 以寻找特 征并发现 规律 ,进而形成可“举一 反三” 的强 大泛化能力 ,可在不 进行微调或少 量微调的情况下完 成多场景任务 , 相当于 AI 完成 了“通识教育” 行业大模型 L1 是指那些针对特定行业或领域的大 费用报表、订票、 买日用品、 填写表格等任务 , 旨在通过自动化操作提升日常生活和工作效率 。 它还可以一边 在 Stub Hub 搜索勇士队比赛门票 ,一边处理网球场预订、寻找清洁服务和 DoorDash 订餐 , 实现多任务并行处理 6. 基于大模型的智能 体 发现矛盾时 , 自动回溯、 验证 ,调整推理路径 2025 年 2 月 3 日 , OpenAI 发布了一款新的智能体产品——10 积分 | 123 页 | 15.88 MB | 6 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告Post-Training 将会成为下一个突破点。 ➢ 自回归模型在数学推理问题上很难进步的一点在于没有办法进行回答的自主修正,如果仅是依靠生成 式方法和扩大参数规模,那么在数学推理任务上带来的收益不会太大。所以需要寻找额外的 Scaling Laws [1]。 [1] Training Verifiers to Solve Math Word Problems https://arxiv.org/pdf/211010 积分 | 76 页 | 8.39 MB | 6 月前3
共 2 条
- 1
