ppt文档 金融垂类大模型试用体验【AI金融新纪元】系列报告(一) VIP文档

1.60 MB 25 页 0 下载 6 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pptx
3
概览
【 AI 金融新纪元】系列报告(一) —— 金融垂类大模型试用体验 证券分析师:胡 翔 执业证书编号: S0600516110001 联系邮箱: hux@dwzq.com.cn 二零二四年一月二十五日 证券研究报告 1. 国内互联网企业、传统金融机构及金融科技企业争相竞逐 ,百模大战如火如荼。 2023 年 5 月中旬 ,奇富科技首先宣布推出自研的金融行业通用 大模型——奇富 GPT ,在业内被称为“ 国内首个金融行业通用大模型 ”。 2023 年 5 月下旬 ,度小满推出国内首个千亿级中文金融大模型“轩 辕 ” ,聚焦于金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务。恒生电子于 2023 年 6 月发布了金融大模型 LightGPT ,并 在 10 月份对其进行升级 ,至此形成“ LightGPT+WarrenQ+ 光子”体系 ,助力恒生大模型实现金融多场景应用。 2023 年 9 月 7 日和 9 月 8 日 , 腾 讯混元大模型和蚂蚁金融大模型相继正式亮相。 2023 年 11 月 ,幻方量化旗下 DeepSeek 推出 DeepSeek LLM 67Bt ,相较于其他金融模型 拥有 更突出的推理、数学、编程等能力。 2024 年开年之初, 同花顺和东方财富分别推出问财 HithinkGPT 和妙想金融大模型, 内测火热进行中。 2. 金融垂类大模型赋能金融业务 ,推动行业业务实现增量提升。 目前各家公司都在致力于以大模型赋能股基 APP 或是金融终端 ,为已有功能注入 AI 能力 ,实现智能客服、智能投顾、智能风险等多场景应用 ,通过大模型多样、便捷、高效的特点提升原有客户粘性、提高获客能力并吸引客 流量 ,推动公司 C 端、 B 端存量业务增长 ,金融大模型的继续推出和不断完善还有望在未来衍生出金融创新业务。 2 前言:金融大模型争相竞逐,百模大战如火如荼 3. 目前同花顺、东方财富、恒生电子、幻方量化所推出的大模型正在火热内测中。 同花顺和东方财富各自推出的大模型都具备实时性较强且能对 内容精准溯源的优势, 同时, 同花顺、东方财富、恒生电子所推出的大模型都实现了海量中文 tokens 的加持 ,金融领域数据覆盖面广。此外, 各类模型还拥有其突出优势。 4. 在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下 ,我们认为金融垂类模型将成为金融科技领域未来的发展重点。我们认为, 具备较大金融交易数据基础、较好应用场景入口、较成熟 AI 技术运用经验的金融科技企业将受益明显 ,推荐【东方财富】、【同花顺】 ,建 议关注【恒生电子】。 5. 风险提示: 1 )监管环境趋严抑制行业创新; 2 )行业竞争加剧; 3 )权益市场大幅波动。 发布机构 金融垂类模型 共同优势 突出优势 同花顺 问财 HithinkGPT 、 AIFinD 实时性较强,且 能精准溯源 金融领域数据覆 盖面广 模型训练创新优化 东方财富 妙想金融大模型 高品质金融数据供给 恒生电子 LightGPT (升级) + WarrenQ+ 光 子 / 轻量化 幻方量化 DeepSeek LLM 67Bt / 数学编程能力强 时间 发布机构 金融垂类模型 2023 年 5 月 度小满 轩辕大模型 奇富科技 奇 富 GPT 2023 年 6 月 恒生电子 LightGPT 2023 年 9 月 蚂蚁集团 蚂 蚁 金 融 大 模 型 AntFinGLM 腾讯云 腾讯云金融行业大模型 2023 年 10 月 恒生电子 LightGPT (升级) + WarrenQ+ 光 子 2023 年 11 月 幻方量化 DeepSeek LLM 67Bt 2024 年 1 月 同花顺 问财 HithinkGPT 、 AIFinD 东方财富 妙想金融大模型 数据来源: iFinD ,妙想大模型,发布机构官方微信公众号,发布机构官方网站,东吴证券研究所 前言:金融大模型争相竞逐,百模大战如火如荼 图表:国内金融垂类 AI 模型发布时间 & 发布机 构 图表:头部金融垂类 AI 模型优 势 3 · 6-7. 投资建议&风险提示 1. AiFinD: PC端、手机端双边发力,打造多场景应用AI功能集合 2.东方财富妙想:致力于搭载“懂金融、懂用户、强数据”的金融生态基因 3 . 恒生电子LightGPT+WarrenQ:打造更专业、更合规、更轻量的金融行业大模型 4. 幻方量化DeepSeek LLM 67Bt:数学能力表现突出,指令跟随、编程能力遥遥领先 5. 金融大模型百花齐放,引领金融行业效率变革,开启数字金融新时代 目录 国内金融垂类大模型试用体验 作为 A 股市场“互联网 + 金融 +AI” 第一股 ,同花顺凭借十余年的人工智能技术积累 ,再度创新 ,推出了 HithinkGPT 大模型。此款大模型 采用 transformer 的 decoder-only 架构 ,提供 7B 、 13B 、 30B 、 70B 和 130B 五种版本选择 ,最大允许 32k 文本输入 ,支持 API 接口 调用、 网页嵌入、共建、私有化部署等能力 ,并为用户提供一站式标注和评测服务。 通用领域: HithinkGPT 大模型在 C-Eval 、 GSM8K 、 MMLU 、 MATH 等 10 多个主流 Benchmark 测评集上的表现全面超越了主流 开源模型 Llama-2 。 金融领域: 同花顺自建了 HithinkFinEval 数据集 ,涵盖了证券从业考试、基金从业考试、会计师资格考试、 CPA 、 CFA 等 17 个金融行 业考试。在这些考试中 ,问财 HithinkGPT-70B 大模型以平均 75.9 分的优异成绩通过考试 ,并且 HithinkGPT 在所有考试科目中都比开源模型 更加优秀。 1. AiFinD : PC 端、手机端双边发力,打造多场景应用 AI 功能 集合 数据来源:同花顺投资助手,同花顺 iFinD ,东吴证券研究 图表:同花顺 HithinkFinEval 数据集考试得 分 图表:同花顺 HithinkGPT 金融考试得 分 6 同花顺 iFinD 平台中的 AiFinD ,是公司基于 HithinkGPT 大模型在平台嵌入的 AI 功能 集合。 AiFinD 系列功能致力于通过 AI 技术的引进帮助金融机构实现更精确的数据分析、更高效的 决策制定, 同时帮助投资者更好地理解市场趋势、识别投资机会 ,帮助平台使用者解决简 单问题 ,协助解决复杂问题。当前 AiFinD 处于试用阶段 ,开放了以下功能: 1. 【 ChatFinD 】 基于 HithinkGPT 大模型, 叠加 iFinD 金融终端的金融数据库、 文本库 打造的 iFinD 平台专属大模型 ,可通过对话指令获取平台指标、行情信息以及相关金融咨 询, 同时获取信息来源 ,确保信息准确性; 2. 【飞研创作】根据所输出研报类型及期望标题 ,基于大模型自动生成大纲和创作思路 ,思 路中包含所需指标来源。飞研创作可以协助使用者编辑思路 ,完成研报编写; 3. 【绘图】基于选取数据为使用者编辑创作出更具有艺术创造力的可视化图形; 4. 【灵动看板】帮助使用者基于问题生成逻辑以图形呈现的可视化分析; 5. 【翻译】为使用者智能翻译研报及公告等内容; 6. 【纪要】根据音频或文档智能识别重要内容, 自动生成会议纪要; 7. 【文档智读】基于大模型智能学习单篇、多篇文档 ,总结文档核心内容和逻辑并准确回答 问题 ,还可对多篇文档进行分类处理; 8. 【 AI 识图洞见数据】基于 AI 大模型 ,智能解析图片中的数值。 1. AiFinD : PC 端、手机端双边发力,打造多场景应用 AI 功能 集合 数据来源:同花顺投资助手,同花顺 iFinD ,东吴证券研究 所 图表:同花顺 AI 产品介 绍 7 手机端 iFinD APP 同步发力 ,优化并新增 AI 功能: 1 )新增路演 AI 纪要 ,帮助快速了解路演回放要点 ,对关键音频实现一键定位。 2 )新增 资讯 AI 总结 , AI 智能总结资讯要点 ,提高信息获取率。 3 )优化 AI 音频传译 ,实现音频文件快速转写 , AI 智能提取内容纪要。 1. AiFinD : PC 端、手机端双边发力,打造多场景应用 AI 功能 集合 数据来源:同花顺投资助手,同花顺 iFinD ,东吴证券研究 所 图表:同花顺 AI 产品介 绍 8 Ai FinD 优势: 1 )金融数据覆盖面广。 同花顺利用自身过去十几年的数据积累以及 市场上公开的金融数据 ,预训练金融语料达到万亿级 tokens , 同时 拥有一套自动化的流程 ,用于数据获取、清洗以及数据质量的验证, 每月可新增数千亿 tokens 优质预训练数据以及数十万条优质微调数据, 确保数据的实时性和准确性。 2 )模型训练创新优化。构建了包括数据配比实验方案、 scaling law 实验体系、模型架构优化、分布式训练框架优化、硬件加速技术等 科学高效的大模型训练体系, 能以更低的训练成本高效地完成 HithinkGPT 大模型家族( 7B 、 13B 、 30B 、 70B 和 130B )的训练。 3 ) 实时性较强。 AiFinD 中先进大模型叠加 iFinD 平台自身拥有的 金融数据库以及各类实时信息 ,使 AiFinD 中大模型可以通过对话指 令获取实时数据和信息 ,并注明来源 ,相较于其他大模型具有更强 的实时性和真实性。 1. AiFinD : PC 端、手机端双边发力,打造多场景应用 AI 功能 集合 数据来源:同花顺,东吴证券研究所 图表:同花顺 AI 产品介 绍 9 妙想金融大模型是东方财富重磅打造的金融行业大语言模型 ,使用 Decoder-only 的 Transformer 网络结构 ,支持 32K 的上下文长度, 致力于满足各类金融场景下的需求。通过自建的数据治理和数据实验流程 ,结合效果预估算法、高效预训练框架、 SFT 、 RLHF 训练等技 术,妙想金融大模型建立起自主研发的技术壁垒。 目前 ,妙想金融大模型已经覆盖了 7B 、 13B 、 34B 、 66B 及 104B ,分别适配不同 的应用场景,提高模型应用的效费比。 图表:东方财富妙想大模型 数据来源:东方财富妙想,东吴证券研究所 10 2. 东方财富妙想:致力于搭载“懂金融、懂用户、强数据”的金融生态基 因 妙想金融能力评测行业领先。一方面 ,使用开源金融评测数据集 OpenFinData 对妙想金融大模型的金融场景能力进行 360 度诊断。 在横跨金融知识、金融计算、金融解读、金融判别、金融分析、金融合规等六大金融模块共十九项金融任务维度的多元金融场景能力的 测试中 ,妙想金融大模型评测综合评分整体较高。 金融场景评测比较优势凸显。另一方面 ,研发团队针对常见金融应用场景 ,对妙想大模型和通用大模型的输出结果进行了人工标注盲 测 ,从而真实直观把脉妙想金融大模型的金融能力。从妙想金融大模型和主流通用大模型在各场景的综合测评结果对比来看 ,妙想金融 大模型在股票对比、个股诊断、实际操作、投资热点解读等金融垂直场景的能力已具备较明显的优势。 数据来源:东方财富 AI ,东吴证券研究所 2. 东方财富妙想:致力于搭载“懂金融、懂用户、强数据”的金融生态基 因 图表:东方财富妙想大模型 VS ChatGPT 11 妙想金融大模型优势: 1 ) 多场景赋能 ,功能覆盖面广。妙想金融大模型发力投研、投顾、投教、 投资等金融核心场景 ,基于资讯、数据、研究、交易、交流等用户场景痛点, 对智能问答和智能投研场景进行了个性化的功能设计 ,提供数据查询、信息 搜索、事件解读、等数百种场景解决方案。 2 ) 高性能推理支撑场景需求。妙想金融大模型通过量化、模型算子优化等 措施极大提高了速度 ,结合 Paged Attention 、 Continuous Batching 、张 量并行推理等技术优化推理框架的性能 ,在金融场景下算力的利用率提高了 数倍。 3 ) 高品质金融数据供给。得益于东方财富二十载深耕 ,平台聚集了海量用 户资源和用户黏性优势 ,积淀了多元的金融业务场景 ,东方财富构建了完备 的金融数据、产业数据等行业通用数据集 ,股吧、财富号等平台优质内容数 据持续涌现 ,持续丰富平台的独家特色数据集。 4 ) 实时性较强 ,并且能精准溯源。可以进行当天股票分析并给出来源, 同 时智能投研的场景能力强大 ,可助力研究员倍速完成研报阅读、挖掘研报增 量信息、总结梳理投资要点并精准溯源。 2. 东方财富妙想:致力于搭载“懂金融、懂用户、强数据”的金融生态基 因 数据来源:妙想大模型,东吴证券研究所 图表:东方财富妙想大模型功能模块 12 恒生电子 LihgtGPT 金融行业大模型,较通用大模型更专业、更合规、更轻量。 LightGPT 拥有更专业的金融语料积累处理和更高效稳定的 大模型训练方式。在金融专业问答、逻辑推理、超长文本处理能力、多模态交互能力、代码能力等在内的金融大模型能力评测中均有不错表 现,并保证内容和指令的合规安全,处于业内领先水平,可以为投顾、客服、投研、运营、风控、合规、研发等金融业务场景提供底层 AI 能 力支持。 光子系列产品,基于 LightGPT 能力,光子大模型系列产品致力于在合规审核、投研算法、客户服务和营销分析方面成为金融从业人员的智 能 助手。 1. 【光子 · 文曲】可以帮助投资顾问提供实时市场数据分析和智能文章润色等功能; 2. 【光子 · 善策】根据会话记录实时分析客户意图,精准定位客户标签,自动检索相关的金融产品及资讯信息,生成专业观点和建议; 3. 【光子 · 慧营】服务企业资管运营、托管运营,为运营工作提供系统智能辅助解决方案; 4. 【光子 · 方圆】为合规和业务人员提供智能问答和一键式合规设置等服务。 数据来源:恒生电子金融行业大模型,东吴证券研究所 3. 恒生电子 LightGPT+WarrenQ :打造更专业、更合规、更轻量的金融行业大模 型 图表:恒生电子金融行业大模型功能模块 13 WarrenQ 系列产品,是一款投研效率工具产品, 旨在提高研究员的工作效率和实现知识高效协同。 WarrenQ 通过 chat 打通工作投研场景, 打造大模型 + 数据 + 工具新一代投研模式。 WarrenQ-Chat 基于大模型叠加搜索和金融数据库,通过对话指令,轻松获得金融行情、资讯和数 据,且每一句生成的对话均支持文本溯源,确保消息准确性。 ChatMiner 可以帮助快速提取文档中的信息,提供精准检索与定位,精炼或拓 展文本。 LightGPT+WarrenQChat 优势: 1) 金融领域生成能力强。基于 2000 亿中文 tokens 的加持, 80+ 中文金融任务的打磨,覆盖了金融绝大多数领域应用场景,且针对于金融任务, 回答速度极快,准确率较高,并支持多种语言输入与输出。 2 )合规性、安全性高。充分学习中国的金融法律法规,在输出时符合中国金融市场的监管要求。 3 )轻量化。支持私有化 / 云部署以及灵活 API 调用,推理端仅需一机 2 卡部署。金融机构可以基于 LightGPT 通过私域任务数据定制化精调大模 型, 打造机构专属大模型,满足个性化需求。 图表:恒生电子 WarrenQ & LightGPT 功能模块 数据来源: WarrenQ ,恒生电子 LightGPT ,东吴证券研究所 3. 恒生电子 LightGPT+WarrenQ :打造更专业、更合规、更轻量的金融行业大模 型 14 幻方量化发布通用语言大模型 DeepSeek LLM 67Bt ,相比开源的同级别模型 LLaMA2 70B , DeepSeek LLM 67B 在近 20 个中英文的公 开评 测榜单上表现更佳。尤其突出的是推理、数学、编程等能力(如: HumanEval 、 MATH 、 CEval 、 CMMLU )。 1 )数学能力排名靠前。 DeepSeek LLM 67B 模型在样本内数学能力(纵轴 GSM8K )排名第三,仅次于 Claude2 和 GPT-4 ,但在样本外数学能力(横轴 Exam Score )排名第二,仅次于 GPT-4 。 2 )指令跟随能力明显领先。使用 Google 在 2023 年 11 月 15 日公开的指令跟随评测集进行测 试, DeepSeek LLM 67B 在一众开源模型中明显领先,拉近了与智能标杆 GPT-4 的距离。 3 )编程能力遥遥领先。使用 LeetCode 全球竞赛测试题进行测试, 来自 DeepSeek 的两大模型遥遥领先,包括通用领域的 DeepSeek LLM 67B 和 11 月初的 DeepSeek Coder 33B 。 4. 幻方量化 DeepSeek LLM 67Bt :数学能力表现突出,指令跟随、编程能力遥遥领 先 数据来源: DeepSeek ,东吴证券研究 所 图表:幻方量化 DeepSeek 模型表 现 15 幻方量化 DeepSeek LLM 67Bt 具有数学编程能力强,敏感安全性较高,模型完全开源,多语言支持等优点。 DeepSeek 优势: 1 )数学编程能力强。 DeepSeek LLM 67Bt 能够快速且正确地解决大部分数学编程任务。 2 )敏感安全性较高。 DeepSeek LLM 67Bt 回答将遵守法律法规,为用户提供准确、可靠的答案,避免传播不实信息或误导用户。 3 )模型完全开源。 DeepSeek LLM 67Bt 具有较高的透明度,用户可以查看和审查代码,了解工作原理和安全性。 数据来源: DeepSeek ,东吴证券研究所 4. 幻方量化 DeepSeek LLM 67Bt :数学能力表现突出,指令跟随、编程能力遥遥领 先 图表:幻方量化 DeepSeek 功能模 块 16 国内 AI 模型产品概况及未来设想 国内 AI 大模型迎来爆发式增长,技术和应用不断发展 ,但与国外顶尖 AI 大模型尚有差距。 自 2022 年 OpenAI 发布 ChatGPT 以来, 国 内迅速形 成大模型共
下载文档到本地,方便使用
- 可预览页数已用完,剩余 23 页请下载阅读 -
文档评分
请文明评论,理性发言.