DeepSeek洞察与大模型应用-人工智能技术发展与应用实践调需512张910B。大量客户无支持微调的算力。单 任务算力消耗与百亿级参数模型不在同一量级 • DS 最惊艳的R1版,一次推理多在10-20秒,更适合 代码、数学、复杂规划等场景,很难响应B端高实时 业务应用场景 • 让DS高效学会私域知识,尚未明显突破,利用DS 蒸馏得 到百亿参数模型,对于从头预训练模型优势还有待观测 -29- 目录 Contents 02 03 01 04 05 -30- 认识大模型的局限性 token的算力和时间消耗 * token数 用户可感知的结果:DeepSeek投入大量算力提供服务,仍然频 繁出现“服务器繁忙”;硅基流动等部署DeepSeek模型服务的第 三方厂商亦无法有效承接流量 l 建议3:学会接受大模型的输出速度,效果越好的模型,速度可能越慢 -33- 认识大模型的局限性:知识实时更新能力差 n 实时知识更新 必要性:引入新知识,保证与时俱进 大模型参数量大,知识更新速度慢,无法实时将最新10 积分 | 37 页 | 5.87 MB | 6 月前3
基于大模型的具身智能系统综述具身智能的概念最早可以上溯至 1950 年图灵 在其著名论文“Computing machinery and intelli- gence”[1] 中对未来机器发展方向的设想: 一个方向 是让机器学会抽象技能, 如下棋; 另一个方向则是 为机器人提供足够好的传感器, 使之可以像人类一 样学习. 前者的思想出现在后来发展的各类神经网 络如多层感知机、卷积神经网络中, 即离身智能; 后 者则逐渐发展出了具身智能的概念 computing, and software-hardware de- velopment.) 郑伟诗 教育部“长江学者奖励计划” 特聘教授, 国家自然科学基金优秀青 年科学基金获得者, 英国皇家学会牛 顿高级学者, IAPR Fellow. 主要研究 方向为协同与交互分析理论与方法, 解决人体建模和人工智能机器人学习 的视觉计算问题. E-mail: zhwshi@mail.sysu.edu intelligence (AI) robotic learn- ing.) 孙富春 清华大学计算机科学与技术 系教授. 1997 年获得清华大学博士学 位. 国家杰出青年科学基金获得者. 中国人工智能学会副理事长, IEEE Fellow. 主要研究方向为智能控制, 智能机器人与具身智能. E-mail: fcsun@tsinghua.edu.cn (SUN Fu-Chun Professor in20 积分 | 19 页 | 10.74 MB | 2 天前3
大模型技术深度赋能保险行业白皮书151页(2024)大模型技术 深度赋能保险行业白皮书 (2024) 阳光保险集团股份有限公司 清华大学五道口金融学院 中国保险学会 科大讯飞股份有限公司 2024年10月 PREFACE 前 言 � 在人类科技发展的历史洪流中,2023年无疑是大模型技术取得突破性进展的元年。 ChatGPT的问世,如同一颗石子投入平静的湖面,激起了全球科技领域的滔天巨浪。它不 仅深刻改变了人机交互的方式,更预20 积分 | 151 页 | 15.03 MB | 2 天前3
共 3 条
- 1
