电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 8GHz 的占比 36%,价格在 1000 美金以上的占比 13%,即旗舰机型占比较低,随着 AI 大模 型在边缘端落地,有望推动新一轮换机潮。 以大语言模型为核心,以语言为接口,控制多 AI 模型系统,构建“贾维斯” 式智能管家。我们认为大语言模型不仅可以实现对话、创意,未来也有望作 为众多复杂 AI 模型的控制中心,同时也是接受用户指令的交互窗口,实现 《钢铁侠》电影中“贾维斯”式综合智能管家。230 积分 | 25 页 | 2.20 MB | 6 月前3
智能技术赋能人力资源管理 2024AI 技术在 HR 领域的应用情况 Part2:认识大语言模型:从原理到应用 Part3:体验大语言模型:使用者的认知与探索 Part4:企业中的大语言模型:价值与实现基础 █ 大语言模型对企业的价值 █ 大语言模型的价值实现基础 Part5:HR 中的大语言模型:影响与应用 █ 大语言模型对 HR 的影响 █ 大语言模型在企业 HR 部门的应用情况 参考资料 参调样本 得以适应文字、 图片、音频等各类任务。在众多的大模型技术中,大语言模型有着更为广泛的应用场景,也受着资本投入的青睐。 它可以帮助 C 端用户完成大量的文字类工作,回答他们的各类问题;同时也可以与 RPA 等技术结合,为 B 端 用户带来更好的流程体验。 经济学家约瑟夫 • 熊彼特所提出的“创造性破坏”可以较为贴切地概括大语言模型为企业带来的影响。 熊彼特认为,创新会破坏企业内部的旧结构, 会打破已有 的市场均衡,为企业带来超额利润。同样,大语言模型作为技术的创新,也会为企业带来效率提升、成本降低 等利好,也会带来管理与竞争模式的变化。作为企业重要的支持部门,HR 部门也同样面临着变化与创新。 上述的利好与变化是企业管理者们、HR 从业者们所关注的,也是本研究报告的出发点。由于大语言模型 是人工智能技术中的一个类别,大语言模型在 HR 领域的运用情况很大程上取决于企业对于人工智能技术的关10 积分 | 90 页 | 10.60 MB | 5 月前3
北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 RL 驱动下自然涌现 Long-CoT 能力 传统 RLHF 背景下, SFT 通常被认为是不可或缺的一步,其逻辑先用大量人工标注的数据来让 模型 初步掌握某种能力(如对话或者语言风格),然后再用 RL 来进一步优化性能 DeepSeek-R1 系列跳过对于大规模人工标注数据的依赖 无需构建和维护高质量的 SFT 数据集,而是让模型直接在 RL 环境中进行探索 https://newsletter.languagemodels.co/p/the-illustrated-deepseek-r1 DeepSeek-R1 Zero 的问题: 长推理过程可读性差、语言混合,帮助性低 Research Questions: 能否在 Zero 基础上兼顾推理性能的同时,提升模型的帮助性和安全性?例如产生 Clear & Coherent CoT10 积分 | 76 页 | 6.72 MB | 5 月前3
2024年汽车AI大模型TOP10分析报告产业研究 战略规划 技术咨询 2 预训练语言模型 预 训 练 微 调 将模型在大规模无标注数据上进 行自监督训练得到预训练模型 将模型在下游各种自然语言处理任 务上的小规模有标注数据进行微调 得到适配模型 AI大模型就是预训练语言模型 通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模型 预训练语⾔模型“预训练 + 微调”技术范式 ⼤规模⽆标注 ⽂本数据 模型预训练 测试数据 最终模型 从海量数据中自动学习知识 Ø Big-data Driven,模型基于大规模语料训练而成; Ø Multi-tasks Adaptive,支持多种任务,包括自然 语言生成NLG和自然语言理解NLU类的任务; Ø Few-shot (Zero-shot),在少甚至无标注样本的 条件下支持推理(自监督学习)。 产业研究 战略规划 技术咨询 3 大模型发展历程 众多预训练模型相继涌现,OpenAI 年,Google提出Transformer 框架在机器翻译中取得显著进步,其分布式学习和强大编码能力受到广泛关注。 Ø 2018 年 Google 和 OpenAI 基于Transformer 提出了预训练语言模型 BERT 和 GPT,显著提高了NLP 任务的性能,并展示出广泛的通用性。 AlexNet (图灵奖得主 Hinton) CAN (Gioodfellow. 图灵奖得主 Bengio)10 积分 | 59 页 | 28.41 MB | 5 月前3
工业大模型应用报告架构,凭借注意力机 制,极大地改善了机器学习模型处理序列数据的能力,尤其是在自然语言处理(NLP) 领域。Transformer 架构的出现,为后续的大模型如 ChatGPT 等奠定了技术基础。 ChatGPT、Bert 等大模型通过海量数据和庞大的计算资源支持,使得模型具备了强大的 通用性和复用性。大模型可以被广泛应用于自然语言处理、计算机视觉、语音识别等 领域的各种任务,能够为各种应用和开发人员提供共享的基础架构,并进一步通过微 用,取得一定的性能表现,支持 不同行业、不同场景的应用构建。 2 工业大模型应用报告 大模型展现出三大基础特征。目前大模型并没有明确的定义,狭义上指大语言模 型,广义上则指包含了语言、声音、图像等多模态大模型。如李飞飞等人工智能学者 所指出,这些模型也可以被称为基础模型(Foundation Model)。我们认为,大模型主 要具备以下三大特征: 参数规模 据或新任务。基于注意力机制 (Attention),通过在大规模、多样化的无标注数据集上进行预训练,大模型能够学 习掌握丰富的通用知识和方法,从而在广泛的场景和任务中使用,例如文本生成、自 然语言理解、翻译、数学推导、逻辑推理和多轮对话等。大模型不需要、或者仅需少 量特定任务的数据样本,即可显著提高在新任务上的表现能力。如 Open AI 曾用 GPT- 4 参加了多种人类基准考试,结果0 积分 | 34 页 | 4.98 MB | 5 月前3
2024年中国人工智能产业研究报告基础设施建设,并因地制宜出台特色政策。尽管GDP增速放缓,AI技术作为新质生产力,凭借 其在提升效率和推动产业升级方面的优势,展现出广阔发展前景,政府支持也为其提供了强劲 动能。资本市场持续关注AI,投资重点聚焦于语言与多模态模型应用、芯片、算力服务等领域, 基础层与应用层协同发展,不断完善产业生态。社会层面,生成式AI的普及加速了市场教育, 公 众 接 受 度 显 著 提 升 , 但 就 业 替 代 、 隐 私 4 目 录 CONTENTS 01 中国大模型产业宏观环境 政策、经济、社会、技术 02 中国大模型产业价值总览 基础层、模型层、应用层 03 中国大模型产业商业进程 语音、视觉、语言及多模态产品 04 中国大模型产业实践案例 典型产品、标杆厂商 05 中国大模型产业发展趋势 产业机遇、关键挑战 5 中国人工智能产业宏观环境 —— 当下,中国人工智能产业 在经济、政策、认知、技术维度的发展环境如何? www.iresearch.com.cn 中国人工智能产业资本环境 语言及多模态赛道目前最受瞩目,同时基础层厂商积极入局 来源:艾瑞咨询研究院自主研究绘制。 从投资轮次的分布情况着眼,战略及股权投资的数量及占比均呈现出显著的上升态势,其中股权投资事件占比高达77.9%。而在应用赛道 的投资分布方面,语言及多模态赛道目前已成为最受瞩目的投资领域。与此同时,以AI芯片、AI算力解决方案、算法架构等为代表的基础0 积分 | 51 页 | 3.35 MB | 5 月前3
2024年中国人工智能产业研究报告基础设施建设,并因地制宜出台特色政策。尽管GDP增速放缓,AI技术作为新质生产力,凭借 其在提升效率和推动产业升级方面的优势,展现出广阔发展前景,政府支持也为其提供了强劲 动能。资本市场持续关注AI,投资重点聚焦于语言与多模态模型应用、芯片、算力服务等领域, 基础层与应用层协同发展,不断完善产业生态。社会层面,生成式AI的普及加速了市场教育, 公 众 接 受 度 显 著 提 升 , 但 就 业 替 代 、 隐 私 4 目 录 CONTENTS 01 中国大模型产业宏观环境 政策、经济、社会、技术 02 中国大模型产业价值总览 基础层、模型层、应用层 03 中国大模型产业商业进程 语音、视觉、语言及多模态产品 04 中国大模型产业实践案例 典型产品、标杆厂商 05 中国大模型产业发展趋势 产业机遇、关键挑战 5 中国人工智能产业宏观环境 —— 当下,中国人工智能产业 在经济、政策、认知、技术维度的发展环境如何? www.iresearch.com.cn 中国人工智能产业资本环境 语言及多模态赛道目前最受瞩目,同时基础层厂商积极入局 来源:艾瑞咨询研究院自主研究绘制。 从投资轮次的分布情况着眼,战略及股权投资的数量及占比均呈现出显著的上升态势,其中股权投资事件占比高达77.9%。而在应用赛道 的投资分布方面,语言及多模态赛道目前已成为最受瞩目的投资领域。与此同时,以AI芯片、AI算力解决方案、算法架构等为代表的基础10 积分 | 51 页 | 3.35 MB | 6 月前3
北京大学-DeepSeek原理和落地应用2025大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具(国内) Ø DeepSeek、 豆包、Kimi、腾讯元宝、智谱清言、 通义千问、秘塔搜索、微信搜索... l 通用模型 Ø 大语言模型(LLM,Large Language Model) Ø 视觉模型(图片、视频) Ø 音频模型 Ø 多模态模型 Ø …… l 行业模型(垂直模型、垂类模型) Ø 教育、医疗、金融等 •Transformer架构:可以并行矩阵计算(GPU),核心是注意力机制(Attention) •编码器(BERT):多数embedding模型,Ernie早期版本,……. •混合网络:T5、GLM •解码器(GPT):大语言模型(LLM),也是传统的多模态模型的核心 •生成式人工智能(GenAI):AIGC •DeepSeek、Qwen、GLM、Step、MiniMax、hunyuan、kimi、…… •OpenAI •OpenAI GPT(ChatGPT)、Claude、Llama、Grok、…… •Diffusion架构:主要用于视觉模型(比如Stable Diffusion、DALLE),现在也开始尝试用于语言模型 •Diffusion+Transformer架构:例如Sora的DiT(加入Diffusion的视觉模型),部分新的多模态模型架构 大模型的发展阶段 生成模型 ref:中文大模型基准测评2024年度报告(202510 积分 | 57 页 | 9.65 MB | 5 月前3
2025具身机器人行业未来展望报告大脑半球,二者由神经纤维构成的胼胝体相连。脑干又可分为中脑、脑桥及延髓三部分。 部位 位置 功能 大脑 又称为端脑,位 于脑的最上部, 占人脑总体积的 约85%,分为左 右两个半球 高级认知:负责思维、记忆、语言、决策、情感灯 复杂功能 感觉与运动:处理视觉、听觉、触觉等信息、并控 制自主运动 小脑 位于大脑后下方, 紧贴脑干后方, 形似蝴蝶。 运动协调:调节肌肉张力、协调精细动作(如鞋子、 弹琴) 平衡与姿势:帮助维持圣体平衡与空间定位 驱动及算法监控部件的各类状态,保证机器人部件的基本运作能力。(2)传递信息的线束及网关,起到各个控制器,传感器信息交互通联的 作用。 部位 在人体中功能 在人形机器人中功能 机器人对应硬件 大脑 高级认知:负责思维、记忆、语言、决策、情感灯复杂功 能 感觉与运动:处理视觉、听觉、触觉等信息、并控制自主 运动 语义理解、环境信息理解、动 作决策等 目前为机器人中央控制器担任此角色, 但目前并未获得相应能力。后续可能 在此基础上进一步增加硬件及算力 但对于高级认知,信息处理能力尚未建立。展望未来,机器人大小脑有望实现分离,大脑算力进一步加强,小脑专注运动控制。 部位 在人体中功能 在人形机器人中功能 机器人对应硬件 大脑 高级认知:负责思维、记忆、语言、决策、情感灯复杂功 能 感觉与运动:处理视觉、听觉、触觉等信息、并控制自主 运动 语义理解、环境信息理解、动 作决策等 目前为机器人中央控制器担任此角色, 但目前并未获得相应能力。后续可能 在此基础上进一步增加硬件及算力0 积分 | 31 页 | 3.33 MB | 4 月前3
2025年自动化人工智能报告第34-46页 第4-8页 01 双星大爆炸 02 你的面孔,在未来 04 新的学习循环 在不同界面看似相同的情况下进行差异 化。 人们与人工智能如何定义一个学习、领 导和创造的正向循环。 03 当大型语言模型 出现时 他们的身体 当人工智能呈指数级扩展时,系统 将会被打乱。 如何基础模型重新定义机 器人学 信任是否是人工智能无 限可能性的极限? 引言 人工智能:自主 宣言 从卡斯帕罗夫的比赛以来,几乎已经过去了30年,而现 在能够使Deep Blue看起来像是一个普通玩家的模型都 坐在每个人的口袋里。图灵测试,曾经被认为是机器智 能的最高标准,现在每天都被人们与大型语言模型(LL M)支持的客户服务机器人和销售人员交流中所打破。 今天的AI模型已经摆脱了过去深度但具体且线性的方法 ,并展示了前所未有的自主性—在他们如何学习、如何 处理任务以及最终能够做什么方面。他们将这种自主性 行业 这可能看起来像是行业内公司之间的通用框架和 通信协议,或者是编码界定行业大挑战的引擎——这 些模型将有助于我们增长对物理学、遗传学、运动等 方面理解。并且对于 国家 和 政府 它汇集了独特的知识、语言、文化、法 律和安全,以帮助行业、公司和公民参与。关键的是 ,这些认知数字大脑不会在孤岛中运作。当它们开始 在不同层面互动时,它们将创造一股上升的智能浪潮 ,提升所有参与方的能力。 认知数字大脑将10 积分 | 66 页 | 5.50 MB | 5 月前3
共 189 条
- 1
- 2
- 3
- 4
- 5
- 6
- 19
