电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 8GHz 的占比 36%,价格在 1000 美金以上的占比 13%,即旗舰机型占比较低,随着 AI 大模 型在边缘端落地,有望推动新一轮换机潮。 以大语言模型为核心,以语言为接口,控制多 AI 模型系统,构建“贾维斯” 式智能管家。我们认为大语言模型不仅可以实现对话、创意,未来也有望作 为众多复杂 AI 模型的控制中心,同时也是接受用户指令的交互窗口,实现 《钢铁侠》电影中“贾维斯”式综合智能管家。230 积分 | 25 页 | 2.20 MB | 6 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。最新版的 GPT-4 在 ChatGPT 的 GPT- 3.5 基础上主要提升了语言模型方面的能力,并添加了多模态功能,在 不同语言情景和内部对抗性真实性评估的表现都显著优于 GPT-3.5,在 各种专业和学术基准上已经表现出人类水平。智能终端接入人工智能大 模型的趋势是明确的,预计很快在下游应用层面将出现 ............................................................................. 16 图 34: Infinix 推出多语言对话能力 AI 向导 ................................................................................. 16 图 35: 是一个大型的多模态模型,相比上一代 ChatGPT 新增了图像功能,同时具备 更精准的语言理解能力。GPT 的升级背后是 OpenAI 的大语言模型的进一步演进,同时 带动下游应用的拓展,涌现出新一批应用场景。 1.1. GPT 迭代更新,人工智能掀起科技潮 GPT 升级至四代,模型能力高速提升。ChatGPT 是由 OpenAI 开发的自然语言生成 模型,采用 Transformer 神经网络架构(又称0 积分 | 28 页 | 2.68 MB | 6 月前3
电子AI+系列专题:复盘英伟达的AI发展之路S0980522090001 l GPU 是人工智能时代下满足深度学习大量计算需求的核心 AI 芯片。 过去五年,大型语言模型的参数规模以指数级增长;从 2018 年起, OpenAI 开始发布生成式预训练语言模型 GPT 以来, GPT 更新换代持续提升模型 及参数规 模; 2022 年 12 月, OpenAI 发布基于 GPT-3.5 的聊天机器人模型 ChatGPT 3 月,英伟达在 GTC 大会上推出 4 个针对各种生成式 AI 应用程序进行优化的推理平台,其中发布带有双 GPU NVLink 的 H100 NVL 加速计算卡, 以支持 ChatGPT 类大型语言模型推理。与适用于 GPT-3 处理的 HGX A100 相比,配备四对 H100 与双 GPU NVLink 的标准服 务器的速度最高可达 10 倍。 l 计算与网络事业部收入占比提升,数据中心超过游戏成为收入主要来源。 突出需求,高并行度的深度学习算法在视觉、语音和自然语言 处理等领域上的广 泛应用使得算力需求呈现指数级增长。 据 Cisco 数据,全球数据中心负载任务量预计由 2016 年的 241.5 万个上升至 2021 年 的 566.7 万个,对应 CAGR 达 18.60% ;其中,云数据中心负载任务量 CAGR 预计达 22% 。 l 以模型中的参数数量衡量,大型语言模型的参数 在过去五年中以指数级增长。随着参数量和训练0 积分 | 30 页 | 1.27 MB | 6 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页摘要:大模型能力提升不断解锁新的应用场景 过去一年,大模型能力的发展速度超出我们预期。以衡量 LLM 的常用的多语言理解均值评 测标准(MMLU)为例,2021 年底全球最先进大模型的 MMLU 5-shot 得分刚达到 60%, 2022 年底超过 70%,而 2023 年底已提升至超过 85%。在语言能力之外,AI 大模型的多模 态能力也快速提升。2023 年初,主流闭源大模型通常为纯文本的 LLM。2023 化方式来处理和回复用户输入,可以模拟人类对话,通过文字或语音与用户进行实时交互。 2010 年代,随着 NLP 等技术的发展,Chatbot 已经在客服、营销、企业信息服务等领域得 到了广泛应用。然而,由于语言理解及生成能力有限,因此 Chatbot 的落地范围局限在 B 端特定服务型场景,并未诞生具有广泛影响力的 C 端产品。2022 年 12 月,ChatGPT 在文 本生成、代码生成与修改、多轮对话等领域展现了大幅超越过去 语音助手、物体识别、生活助理等 AI 功能已在 AR/VR 产品中广泛出现。语音助手功能让 AR 眼镜能够通过上下文语义理解与用户进行更自然的交流,如李未可 Meta Lens S3 通过 大型语言模型 AI 系统提供闲聊和建议。物体识别技术使 AR 眼镜能够识别现实世界中的物 体,例如 Meta 雷朋智能眼镜引入建筑识别和菜单翻译功能。此外,生活助理功能与用户的 社交生活深度绑定,提供聊天回0 积分 | 40 页 | 2.60 MB | 6 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域不分伯仲,训练成本仅约为 558 万美元。1 月 20 日,DeepSeek 开源 R1 模型,后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 图 1:DeepSeek R1 性能比肩 OpenAI o1 数据来源:DeepSeek公众号,东莞证券研究所 同时,DeepSeek-R1 事项,此外亦 具备录音转文字、多种语言及方言实时同传翻译的功能,首发价为 1,399 元。 表 1:多款智能耳机产品密集推出 产品 发 布 时 间 价格 (元) AI 功能 iKKO ActiveBuds 2024 年 2 月 1,799 接入 OpenAI 的 GPT-4o 模型,能够回答用户提出问题;支持 62 种 语言同声传译,57 种语言录音转笔记,提炼内容要点、优化语法、 科大讯飞 iFLYBUDS Pro2 2024 年 5 月 1,399 搭载 viaim AI 会议助理,智能分析耳机实时转写的内容,提取关 键信息、生成会议摘要及待办事项,具备录音转文字、多种语言 及方言实时同传翻译的功能。单次续航 9 小时,搭配充电仓达 36 小时 SoundAI FairyClip C1 2024 年 7 月 199 接入 AzeroGPT 壹元大模型,支持实时转写、文件转写、多语翻译、0 积分 | 23 页 | 2.65 MB | 6 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 自然 语言推理等任务上,性能比肩 OpenAI-o1 正式版。 2 月 1 日消息,据彭博社报道, DeepSeek 的人工智能助手在 140 个市场下载次数最多的移动应用程序排行榜 上名列前茅。国外大型科技公司如微软、 深度求索 ) 公司成立于 2023 年 5 月,是一家致力于实现 AGI(Artificial General Intelligence ,通用人工智能 ) 的创新型科技公司,专注于开发先进 的大语言模型和相关技术。 DeepSeek 由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。 l 2024 年 5 月, DeepSeek-V2 发布,成为全球最强开源通用 DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提 升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1 正式版。同时 DeepSeek 开源 R1 推理模型,允许所有人在遵循 MIT License 的情况 下,蒸馏 R1 训练其他模型。 2023/050 积分 | 38 页 | 1.95 MB | 6 月前3
中国零售数字化企业出海现状与趋势白皮书本土化深度运营。零售数字化企业在全球化进程中,需要充分考虑不同国家和地 区的文化差异和法律法规,深入了解当地零售市场的商业模式、消费习惯等,确定 目标客户群体,对产品功能进行定制化开发,例如在语言多样性的国家,软件产品 需支持多种当地语言。组建本地化的团队是实现深度运营的重要保障。本地化团 队成员更熟悉当地市场环境、文化背景和客户需求,能够与客户进行有效的沟通 和交流。深度的市场调研和周全的售后服务也是维持良好企业形象和品牌声誉的 成功落地,需要深入不同国 家和地区的市场,推出最适配当地需求的产品和服务,这就要求企业灵活地进行 本土化调整。本土化不仅涉及语言,还包括对当地文化、商业习惯、消费习惯、法律 法规、支付方式等多个方面。例如在东南亚、中东等多国家集合的多语言地区,产 品需具备多种语言版本,以便于不同国家和地区的消费者使用。了解不同国家和 地区消费者的支付习惯、消费偏好等,从而对商品管理、门店管理、供应链管理等 �)智能化营销服务,提升客户体验。零售数字化企业利用自然语言处理(NLP)等 技术,根据当地文化习俗、语言习惯等进行优化调整,进行智能化营销,帮助企业 提高知名度。基于NLP、生成式AI、深度学习、情感分析系统等技术,零售数字化企 业打造以AI机器人为核心的智能客服服务系统,生成式 AI 可以在品牌声音和知 识库的指引下与消费者进行更多双向的自然语言交互,让原本平淡、片面的沟通 重新焕发出人性的10 积分 | 39 页 | 19.55 MB | 4 月前3
电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放模型引发全球关注。 据 DeepSeek 官网数据,DeepSeek-R1 在后训练阶段大规模使用了强化 学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官0 积分 | 4 页 | 269.47 KB | 6 月前3
数字服务与数字运营的市场现状报告专项分期 发卡 / 激 活 坐席维度 服务型 专家型 价值型 卡人画像 精明羊毛档 年轻潜力型 风险用户型 客群属性 高频消费型 分期依赖型 商旅常客 【技术地基】 自然语言处理、 动态学习和智能策略匹配组合 产介 异议处理 促成 开场白 铺垫 核身 结束语 场景维度 场景细分 数字化培训管理 【说明】 1. 每个场景对应不同的话术场景对象; 260 积分 | 48 页 | 12.97 MB | 5 月前3
美国研究报告:2025数据中心市场 平衡前所未有的机会与战略风险当我们在编译这份报告时,中国宣布推出的颠覆性人 工智能模型——DeepSeek——引入了一个可能对数 据中心行业产生深远影响的新变量,特别是对超大规 模供应商而言。DeepSeek在自然语言处理方面取得 了重大进展,包括增强的上下文理解、更快的模型训 练能力以及提高的多语言水平,这些都使其区别于现 有的AI模型。值得注意的是,这些改进在更高的效率 以及更低成本下实现,挑战了关于开发前沿AI模型所 需的资源强度先前的假设。这一进展凸显了技术迅速0 积分 | 53 页 | 6.67 MB | 5 月前3
共 13 条
- 1
- 2
