金融垂类大模型试用体验【AI金融新纪元】系列报告(一),提供 7B 、 13B 、 30B 、 70B 和 130B 五种版本选择 ,最大允许 32k 文本输入 ,支持 API 接口 调用、 网页嵌入、共建、私有化部署等能力 ,并为用户提供一站式标注和评测服务。 通用领域: HithinkGPT 大模型在 C-Eval 、 GSM8K 、 MMLU 、 MATH 等 10 多个主流 Benchmark 测评集上的表现全面超越了主流 开源模型 数据”的金融生态基 因 妙想金融能力评测行业领先。一方面 ,使用开源金融评测数据集 OpenFinData 对妙想金融大模型的金融场景能力进行 360 度诊断。 在横跨金融知识、金融计算、金融解读、金融判别、金融分析、金融合规等六大金融模块共十九项金融任务维度的多元金融场景能力的 测试中 ,妙想金融大模型评测综合评分整体较高。 金融场景评测比较优势凸显。另一方面 ,研发团队针对常见金融应用场景 金融行业大模型,较通用大模型更专业、更合规、更轻量。 LightGPT 拥有更专业的金融语料积累处理和更高效稳定的 大模型训练方式。在金融专业问答、逻辑推理、超长文本处理能力、多模态交互能力、代码能力等在内的金融大模型能力评测中均有不错表 现,并保证内容和指令的合规安全,处于业内领先水平,可以为投顾、客服、投研、运营、风控、合规、研发等金融业务场景提供底层 AI 能 力支持。 光子系列产品,基于 LightGPT10 积分 | 25 页 | 1.60 MB | 1 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域......... 5 图 4 :产品增长 1 亿用户所需时间 ....................................................... 5 图 5 :主要模型评测 ................................................................... 7 图 6 :主要模型 API 定价 ........... 请务必阅读末页声明。 1. DeepSeek 推动模型平权,关注 AI 终端及算力领域 DeepSeek 以更低成本提供对标 o1 模型。2024 年 12 月,DeepSeek V3 首个版本上线,在 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型,并在性能上和 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲,训练成本仅约为 558 万美元。1 tokens 输入为 0.1 美元,每百万 tokens 输出为 0.4 美元,相较于 DeepSeek R1 具备较强竞争力。 电子行业深度报告 7 请务必阅读末页声明。 图 5:主要模型评测 图 6:主要模型 API 定价 数据来源:artificialanalysis.ai,东莞证券研究所 数据来源:artificialanalysis.ai,东莞证券研究所 2 月 18 日,马斯克旗下的0 积分 | 23 页 | 2.65 MB | 7 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求在 大模型竞技场 (LMSYS) 位列全球开源模型第一名,依靠创新结构,将推理成本降低近百倍。 l 2024 年 12 月, DeepSeek-V3 发布,性能对齐海外领军闭源模型。该模型在多项评测集上超越了阿里 Qwen2.5-72B 、 Meta 的 Llama-3.1-405B 等其他开源 模型,并 逼近 GPT-4o 、 Claude-3.5-Sonnet 等顶尖闭源模型。据官方技术论文披露, 首个版本上线并同步开源。 DeepSeek-V3 为自研 MoE 模型,共有 671B 参数,每个 token 激活 37B ,在 14.8T token 上进行 预训练。 DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 及 Claude-3.5-Sonnet 不分伯仲。 l DeepSeek-V3 发布,性能对齐海外领军闭源模 型 图: DeepSeek-V3 等模型执行不同推理任务性能对比 图: DeepSeek-V3 具有更优的模型性能 / 价格比例 图: DeepSeek-V3 等模型多项评测成绩对比 资料来源: DeepSeek 官网,国信证券经济研究所 整理 资料来源: DeepSeek 官网,国信证券经济研究所 整理 资料来源: DeepSeek 官网,国信证券经济研究所 整理0 积分 | 38 页 | 1.95 MB | 7 月前3
2024中国主要城市交通分析报告-高德地图步行出行意愿指数 17 城市地面道路交通分析 第二章 18 第 二 章 城 市 交 通 • 随着城市交通复杂性增加和智能交通的飞速发展,单一指标的评价和诊断已不能满足我国交通运行的多样化评测。高德运用城市交通诊 断评价模型“交通健康指数”综合性评价方法,全面刻画城市交通运行状况。该指数由六项交通运行指标组成,对城市进行全方位立体 化运行健康评价分析。 • 交通健康指数算法沿用国际10 积分 | 30 页 | 2.00 MB | 7 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页附录:国内外大模型公司进展 2022 年 11 月,OpenAI 推出基于 GPT-3.5 的 ChatGPT 后,引发全球 AI 大模型技术开发 与投资热潮。AI 大模型性能持续快速提升。以衡量 LLM 的常用评测标准 MMLU 为例,2021 年底全球最先进大模型的 MMLU 5-shot 得分刚达到 60%,2022 年底超过 70%,而 2023 年底已提升至超过 85%。以 OpenAI 为例,2020 科技巨头目前主要模型的布局 注:MMLU(Multilingual Massively Multilingual Understanding,大规模多任务语言理解)是一个包含 57 个多选问答任务的英文评测数据集,涵盖了初等数学、美国历 史、计算机科学、法律等领域,难度覆盖高中水平到专家水平的人类知识。它是用于评估大模型在跨语言和多领域知识理解方面性能的一个重要基准。 资料来源:公司官网,华泰研究0 积分 | 40 页 | 2.60 MB | 7 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页AI 技术部和同济大学联合主导的“非洲本土语言 AI 言语技术开创 者”项目斩获 2022 中非青年创新创业大赛一等奖。此外,公司正式推出自研百亿级参 数大语言模型 Sahara,目前在部分场景问答评测接近 ChatGPT 的 92.35%,同时公司积 极开展垂直领域多模态感知与交互技术等研究,基于长期积累的针对非洲的语音、图像、 视频等资料库,我们预计公司未来有望打造超越通用大模型的垂直领域0 积分 | 28 页 | 2.68 MB | 7 月前3
工业园区国际指南本地化指标体系对比研究报告推动园区管理机构和企业的国际化发 展 推动中国工业园区管理机构和企业与国际接轨,提 升中国工业园区的国际竞争力。第一,积极推动园 区管委会、运营企业以及园区内企业开展国际化认 证,以国际标准对园区发展进行系统评测,了解园 区发展存在的问题和与国际标准存在的差异。第二, 借助联合国工业发展组织等国际层面促进工业园区 发展的平台,了解国际层面在推动工业园区经济发 展、社会发展和环境保护等方面的最新理念和先进10 积分 | 195 页 | 9.44 MB | 1 月前3
共 7 条
- 1
