金融垂类大模型试用体验【AI金融新纪元】系列报告（一）

语言	格式	评分
中文（简体）	.pptx	3
概览
【 AI 金融新纪元】系列报告（一） —— 金融垂类大模型试用体验证券分析师：胡翔执业证书编号： S0600516110001 联系邮箱： hux@dwzq.com.cn 二零二四年一月二十五日证券研究报告 1. 国内互联网企业、传统金融机构及金融科技企业争相竞逐，百模大战如火如荼。 2023 年 5 月中旬，奇富科技首先宣布推出自研的金融行业通用大模型——奇富 GPT ，在业内被称为“ 国内首个金融行业通用大模型 ”。 2023 年 5 月下旬，度小满推出国内首个千亿级中文金融大模型“轩辕 ” ，聚焦于金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务。恒生电子于 2023 年 6 月发布了金融大模型 LightGPT ，并在 10 月份对其进行升级，至此形成“ LightGPT+WarrenQ+ 光子”体系，助力恒生大模型实现金融多场景应用。 2023 年 9 月 7 日和 9 月 8 日，腾讯混元大模型和蚂蚁金融大模型相继正式亮相。 2023 年 11 月，幻方量化旗下 DeepSeek 推出 DeepSeek LLM 67Bt ，相较于其他金融模型拥有更突出的推理、数学、编程等能力。 2024 年开年之初，同花顺和东方财富分别推出问财 HithinkGPT 和妙想金融大模型，内测火热进行中。 2. 金融垂类大模型赋能金融业务，推动行业业务实现增量提升。目前各家公司都在致力于以大模型赋能股基 APP 或是金融终端，为已有功能注入 AI 能力，实现智能客服、智能投顾、智能风险等多场景应用，通过大模型多样、便捷、高效的特点提升原有客户粘性、提高获客能力并吸引客流量，推动公司 C 端、 B 端存量业务增长，金融大模型的继续推出和不断完善还有望在未来衍生出金融创新业务。 2 前言：金融大模型争相竞逐，百模大战如火如荼 3. 目前同花顺、东方财富、恒生电子、幻方量化所推出的大模型正在火热内测中。同花顺和东方财富各自推出的大模型都具备实时性较强且能对内容精准溯源的优势，同时，同花顺、东方财富、恒生电子所推出的大模型都实现了海量中文 tokens 的加持，金融领域数据覆盖面广。此外，各类模型还拥有其突出优势。 4. 在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下，我们认为金融垂类模型将成为金融科技领域未来的发展重点。我们认为，具备较大金融交易数据基础、较好应用场景入口、较成熟 AI 技术运用经验的金融科技企业将受益明显，推荐【东方财富】、【同花顺】，建议关注【恒生电子】。 5. 风险提示： 1 ）监管环境趋严抑制行业创新； 2 ）行业竞争加剧； 3 ）权益市场大幅波动。发布机构金融垂类模型共同优势突出优势同花顺问财 HithinkGPT 、 AIFinD 实时性较强，且能精准溯源金融领域数据覆盖面广模型训练创新优化东方财富妙想金融大模型高品质金融数据供给恒生电子 LightGPT （升级） + WarrenQ+ 光子 / 轻量化幻方量化 DeepSeek LLM 67Bt / 数学编程能力强时间发布机构金融垂类模型 2023 年 5 月度小满轩辕大模型奇富科技奇富 GPT 2023 年 6 月恒生电子 LightGPT 2023 年 9 月蚂蚁集团蚂蚁金融大模型 AntFinGLM 腾讯云腾讯云金融行业大模型 2023 年 10 月恒生电子 LightGPT （升级） + WarrenQ+ 光子 2023 年 11 月幻方量化 DeepSeek LLM 67Bt 2024 年 1 月同花顺问财 HithinkGPT 、 AIFinD 东方财富妙想金融大模型数据来源： iFinD ，妙想大模型，发布机构官方微信公众号，发布机构官方网站，东吴证券研究所前言：金融大模型争相竞逐，百模大战如火如荼图表：国内金融垂类 AI 模型发布时间 & 发布机构图表：头部金融垂类 AI 模型优势 3 · 6-7. 投资建议&风险提示 1. AiFinD： PC端、手机端双边发力，打造多场景应用AI功能集合 2.东方财富妙想：致力于搭载“懂金融、懂用户、强数据”的金融生态基因 3 . 恒生电子LightGPT+WarrenQ：打造更专业、更合规、更轻量的金融行业大模型 4. 幻方量化DeepSeek LLM 67Bt：数学能力表现突出，指令跟随、编程能力遥遥领先 5. 金融大模型百花齐放，引领金融行业效率变革，开启数字金融新时代目录国内金融垂类大模型试用体验作为 A 股市场“互联网 + 金融 +AI” 第一股，同花顺凭借十余年的人工智能技术积累，再度创新，推出了 HithinkGPT 大模型。此款大模型采用 transformer 的 decoder-only 架构，提供 7B 、 13B 、 30B 、 70B 和 130B 五种版本选择，最大允许 32k 文本输入，支持 API 接口调用、网页嵌入、共建、私有化部署等能力，并为用户提供一站式标注和评测服务。通用领域： HithinkGPT 大模型在 C-Eval 、 GSM8K 、 MMLU 、 MATH 等 10 多个主流 Benchmark 测评集上的表现全面超越了主流开源模型 Llama-2 。金融领域：同花顺自建了 HithinkFinEval 数据集，涵盖了证券从业考试、基金从业考试、会计师资格考试、 CPA 、 CFA 等 17 个金融行业考试。在这些考试中，问财 HithinkGPT-70B 大模型以平均 75.9 分的优异成绩通过考试，并且 HithinkGPT 在所有考试科目中都比开源模型更加优秀。 1. AiFinD ： PC 端、手机端双边发力，打造多场景应用 AI 功能集合数据来源：同花顺投资助手，同花顺 iFinD ，东吴证券研究图表：同花顺 HithinkFinEval 数据集考试得分图表：同花顺 HithinkGPT 金融考试得分 6 同花顺 iFinD 平台中的 AiFinD ，是公司基于 HithinkGPT 大模型在平台嵌入的 AI 功能集合。 AiFinD 系列功能致力于通过 AI 技术的引进帮助金融机构实现更精确的数据分析、更高效的决策制定，同时帮助投资者更好地理解市场趋势、识别投资机会，帮助平台使用者解决简单问题，协助解决复杂问题。当前 AiFinD 处于试用阶段，开放了以下功能： 1. 【 ChatFinD 】基于 HithinkGPT 大模型，叠加 iFinD 金融终端的金融数据库、文本库打造的 iFinD 平台专属大模型，可通过对话指令获取平台指标、行情信息以及相关金融咨询，同时获取信息来源，确保信息准确性； 2. 【飞研创作】根据所输出研报类型及期望标题，基于大模型自动生成大纲和创作思路，思路中包含所需指标来源。飞研创作可以协助使用者编辑思路，完成研报编写； 3. 【绘图】基于选取数据为使用者编辑创作出更具有艺术创造力的可视化图形； 4. 【灵动看板】帮助使用者基于问题生成逻辑以图形呈现的可视化分析； 5. 【翻译】为使用者智能翻译研报及公告等内容； 6. 【纪要】根据音频或文档智能识别重要内容，自动生成会议纪要； 7. 【文档智读】基于大模型智能学习单篇、多篇文档，总结文档核心内容和逻辑并准确回答问题，还可对多篇文档进行分类处理； 8. 【 AI 识图洞见数据】基于 AI 大模型，智能解析图片中的数值。 1. AiFinD ： PC 端、手机端双边发力，打造多场景应用 AI 功能集合数据来源：同花顺投资助手，同花顺 iFinD ，东吴证券研究所图表：同花顺 AI 产品介绍 7 手机端 iFinD APP 同步发力，优化并新增 AI 功能： 1 ）新增路演 AI 纪要，帮助快速了解路演回放要点，对关键音频实现一键定位。 2 ）新增资讯 AI 总结， AI 智能总结资讯要点，提高信息获取率。 3 ）优化 AI 音频传译，实现音频文件快速转写， AI 智能提取内容纪要。 1. AiFinD ： PC 端、手机端双边发力，打造多场景应用 AI 功能集合数据来源：同花顺投资助手，同花顺 iFinD ，东吴证券研究所图表：同花顺 AI 产品介绍 8 Ai FinD 优势： 1 ）金融数据覆盖面广。同花顺利用自身过去十几年的数据积累以及市场上公开的金融数据，预训练金融语料达到万亿级 tokens ，同时拥有一套自动化的流程，用于数据获取、清洗以及数据质量的验证，每月可新增数千亿 tokens 优质预训练数据以及数十万条优质微调数据，确保数据的实时性和准确性。 2 ）模型训练创新优化。构建了包括数据配比实验方案、 scaling law 实验体系、模型架构优化、分布式训练框架优化、硬件加速技术等科学高效的大模型训练体系，能以更低的训练成本高效地完成 HithinkGPT 大模型家族（ 7B 、 13B 、 30B 、 70B 和 130B ）的训练。 3 ）实时性较强。 AiFinD 中先进大模型叠加 iFinD 平台自身拥有的金融数据库以及各类实时信息，使 AiFinD 中大模型可以通过对话指令获取实时数据和信息，并注明来源，相较于其他大模型具有更强的实时性和真实性。 1. AiFinD ： PC 端、手机端双边发力，打造多场景应用 AI 功能集合数据来源：同花顺，东吴证券研究所图表：同花顺 AI 产品介绍 9 妙想金融大模型是东方财富重磅打造的金融行业大语言模型，使用 Decoder-only 的 Transformer 网络结构，支持 32K 的上下文长度，致力于满足各类金融场景下的需求。通过自建的数据治理和数据实验流程，结合效果预估算法、高效预训练框架、 SFT 、 RLHF 训练等技术，妙想金融大模型建立起自主研发的技术壁垒。目前，妙想金融大模型已经覆盖了 7B 、 13B 、 34B 、 66B 及 104B ，分别适配不同的应用场景，提高模型应用的效费比。图表：东方财富妙想大模型数据来源：东方财富妙想，东吴证券研究所 10 2. 东方财富妙想：致力于搭载“懂金融、懂用户、强数据”的金融生态基因妙想金融能力评测行业领先。一方面，使用开源金融评测数据集 OpenFinData 对妙想金融大模型的金融场景能力进行 360 度诊断。在横跨金融知识、金融计算、金融解读、金融判别、金融分析、金融合规等六大金融模块共十九项金融任务维度的多元金融场景能力的测试中，妙想金融大模型评测综合评分整体较高。金融场景评测比较优势凸显。另一方面，研发团队针对常见金融应用场景，对妙想大模型和通用大模型的输出结果进行了人工标注盲测，从而真实直观把脉妙想金融大模型的金融能力。从妙想金融大模型和主流通用大模型在各场景的综合测评结果对比来看，妙想金融大模型在股票对比、个股诊断、实际操作、投资热点解读等金融垂直场景的能力已具备较明显的优势。数据来源：东方财富 AI ，东吴证券研究所 2. 东方财富妙想：致力于搭载“懂金融、懂用户、强数据”的金融生态基因图表：东方财富妙想大模型 VS ChatGPT 11 妙想金融大模型优势： 1 ）多场景赋能，功能覆盖面广。妙想金融大模型发力投研、投顾、投教、投资等金融核心场景，基于资讯、数据、研究、交易、交流等用户场景痛点，对智能问答和智能投研场景进行了个性化的功能设计，提供数据查询、信息搜索、事件解读、等数百种场景解决方案。 2 ）高性能推理支撑场景需求。妙想金融大模型通过量化、模型算子优化等措施极大提高了速度，结合 Paged Attention 、 Continuous Batching 、张量并行推理等技术优化推理框架的性能，在金融场景下算力的利用率提高了数倍。 3 ）高品质金融数据供给。得益于东方财富二十载深耕，平台聚集了海量用户资源和用户黏性优势，积淀了多元的金融业务场景，东方财富构建了完备的金融数据、产业数据等行业通用数据集，股吧、财富号等平台优质内容数据持续涌现，持续丰富平台的独家特色数据集。 4 ）实时性较强，并且能精准溯源。可以进行当天股票分析并给出来源，同时智能投研的场景能力强大，可助力研究员倍速完成研报阅读、挖掘研报增量信息、总结梳理投资要点并精准溯源。 2. 东方财富妙想：致力于搭载“懂金融、懂用户、强数据”的金融生态基因数据来源：妙想大模型，东吴证券研究所图表：东方财富妙想大模型功能模块 12 恒生电子 LihgtGPT 金融行业大模型，较通用大模型更专业、更合规、更轻量。 LightGPT 拥有更专业的金融语料积累处理和更高效稳定的大模型训练方式。在金融专业问答、逻辑推理、超长文本处理能力、多模态交互能力、代码能力等在内的金融大模型能力评测中均有不错表现，并保证内容和指令的合规安全，处于业内领先水平，可以为投顾、客服、投研、运营、风控、合规、研发等金融业务场景提供底层 AI 能力支持。光子系列产品，基于 LightGPT 能力，光子大模型系列产品致力于在合规审核、投研算法、客户服务和营销分析方面成为金融从业人员的智能助手。 1. 【光子 · 文曲】可以帮助投资顾问提供实时市场数据分析和智能文章润色等功能； 2. 【光子 · 善策】根据会话记录实时分析客户意图，精准定位客户标签，自动检索相关的金融产品及资讯信息，生成专业观点和建议； 3. 【光子 · 慧营】服务企业资管运营、托管运营，为运营工作提供系统智能辅助解决方案； 4. 【光子 · 方圆】为合规和业务人员提供智能问答和一键式合规设置等服务。数据来源：恒生电子金融行业大模型，东吴证券研究所 3. 恒生电子 LightGPT+WarrenQ ：打造更专业、更合规、更轻量的金融行业大模型图表：恒生电子金融行业大模型功能模块 13 WarrenQ 系列产品，是一款投研效率工具产品，旨在提高研究员的工作效率和实现知识高效协同。 WarrenQ 通过 chat 打通工作投研场景，打造大模型 + 数据 + 工具新一代投研模式。 WarrenQ-Chat 基于大模型叠加搜索和金融数据库，通过对话指令，轻松获得金融行情、资讯和数据，且每一句生成的对话均支持文本溯源，确保消息准确性。 ChatMiner 可以帮助快速提取文档中的信息，提供精准检索与定位，精炼或拓展文本。 LightGPT+WarrenQChat 优势： 1) 金融领域生成能力强。基于 2000 亿中文 tokens 的加持， 80+ 中文金融任务的打磨，覆盖了金融绝大多数领域应用场景，且针对于金融任务，回答速度极快，准确率较高，并支持多种语言输入与输出。 2 ）合规性、安全性高。充分学习中国的金融法律法规，在输出时符合中国金融市场的监管要求。 3 ）轻量化。支持私有化 / 云部署以及灵活 API 调用，推理端仅需一机 2 卡部署。金融机构可以基于 LightGPT 通过私域任务数据定制化精调大模型，打造机构专属大模型，满足个性化需求。图表：恒生电子 WarrenQ & LightGPT 功能模块数据来源： WarrenQ ，恒生电子 LightGPT ，东吴证券研究所 3. 恒生电子 LightGPT+WarrenQ ：打造更专业、更合规、更轻量的金融行业大模型 14 幻方量化发布通用语言大模型 DeepSeek LLM 67Bt ，相比开源的同级别模型 LLaMA2 70B ， DeepSeek LLM 67B 在近 20 个中英文的公开评测榜单上表现更佳。尤其突出的是推理、数学、编程等能力（如： HumanEval 、 MATH 、 CEval 、 CMMLU ）。 1 ）数学能力排名靠前。 DeepSeek LLM 67B 模型在样本内数学能力（纵轴 GSM8K ）排名第三，仅次于 Claude2 和 GPT-4 ，但在样本外数学能力（横轴 Exam Score ）排名第二，仅次于 GPT-4 。 2 ）指令跟随能力明显领先。使用 Google 在 2023 年 11 月 15 日公开的指令跟随评测集进行测试， DeepSeek LLM 67B 在一众开源模型中明显领先，拉近了与智能标杆 GPT-4 的距离。 3 ）编程能力遥遥领先。使用 LeetCode 全球竞赛测试题进行测试，来自 DeepSeek 的两大模型遥遥领先，包括通用领域的 DeepSeek LLM 67B 和 11 月初的 DeepSeek Coder 33B 。 4. 幻方量化 DeepSeek LLM 67Bt ：数学能力表现突出，指令跟随、编程能力遥遥领先数据来源： DeepSeek ，东吴证券研究所图表：幻方量化 DeepSeek 模型表现 15 幻方量化 DeepSeek LLM 67Bt 具有数学编程能力强，敏感安全性较高，模型完全开源，多语言支持等优点。 DeepSeek 优势： 1 ）数学编程能力强。 DeepSeek LLM 67Bt 能够快速且正确地解决大部分数学编程任务。 2 ）敏感安全性较高。 DeepSeek LLM 67Bt 回答将遵守法律法规，为用户提供准确、可靠的答案，避免传播不实信息或误导用户。 3 ）模型完全开源。 DeepSeek LLM 67Bt 具有较高的透明度，用户可以查看和审查代码，了解工作原理和安全性。数据来源： DeepSeek ，东吴证券研究所 4. 幻方量化 DeepSeek LLM 67Bt ：数学能力表现突出，指令跟随、编程能力遥遥领先图表：幻方量化 DeepSeek 功能模块 16 国内 AI 模型产品概况及未来设想国内 AI 大模型迎来爆发式增长，技术和应用不断发展，但与国外顶尖 AI 大模型尚有差距。自 2022 年 OpenAI 发布 ChatGPT 以来，国内迅速形成大模型共