DeepSeek大模型及其企业应用实践DeepSeek大模型及其企业应用实践 林子雨 副教授 厦门大学 DeepSeek 厦门大学大数据教学团队作品 2025年3月3日 每个人都可以读懂的大模型科普报告(企业篇) 厦门大学大数据教学团队 团队联系方式:ziyulin@xmu.edu.cn 国内高校大数据教学的重要贡献者 团队负责人:林子雨 副教授 年轻力量:核心成员全部46周岁以下 结构合理:教学型、科研型、实验工程师 1. 大模型:人工智能的前沿 2. 大模型产品 3. 大模型的行业应用 4. 企业大模型落地方案 5. 智能体的企业应用 6. 厂商提供的企业级大模型服务 7. 大模型典型应用案例 8. AIGC与企业应用实践 9. 大模型未来发展趋势 厦门大学大数据教学团队作品 1.大模型:人工智能的前沿 1.1 大模型的概念 1.2 大模型的发展历程 1.3 人工智能与大模型的关系 1.4 大模型分类 大模型分类 1.1 大模型的概念 大模型通常指的是大规模的人工智能模型,是一种基于深度学习技术,具有 海量参数、强大的学习能力和泛化能力,能够处理和生成多种类型数据的人 工智能模型。 通常说的大模型的“大”的特点体现在: 参数数量庞大 训练数据量大 计算资源需求高 2020年,OpenAI公司推出了GPT-3,模型参数规模达到了1750亿。 2023年3月发布的GPT-4的参数规模是GPT-3的10倍以上,达到110 积分 | 147 页 | 16.82 MB | 6 月前3
大模型时代的AI教育:思考与实践2024大模型时代的AI教育:思考与实践 肖睿 xiaorui@pku.edu.cn 主要内容 30分钟和大家分享的内容: • 01:对AI技术的认知 • 02:对AI教育的思考 • 03:我们的AI教育实践 VUCA时代,AI技术日新月异,所有的认知、思考、实践都在迭代中…… 01 对AI技术的认知 AI是一种工具,也是一种赋能,更是一种思考范式。 。 我们从三个角度来认知AI技术: • 人工智能的本质 • 大模型的能力边界 • 通向AGI之路 01 对AI技术的认知:人工智能的本质 智能(Intelligence):以模型为核心,是对真实世界的模拟和解释 人类智能 • 抽象(语言):概念,数字,理念 • 逻辑(理性):归纳,演绎,类比 • 计算(模型):科学方法 • 基于观测经验,发现规律 Diffusion、transformer ◼ 从NLU+NLG到LLM(大语言模型) 1. 语言逻辑和数据集蕴含了人类的认知智能 2. LLM是人类的认知智能的实现方式之一 3. LLM的原理很简单;工程很复杂;效果很神奇 01 对AI技术的认知:大模型的能力边界 用人工神经网络获取网络模型:深度学习-Transformer模型-大语言模型 大语言模型的核心原理:数据化-语义化-NTP(Next10 积分 | 36 页 | 4.04 MB | 6 月前3
大模型平民化开启“AI+医疗”新纪元-国联民生证券证券研究报告 报告评级:强于大市丨维持 大模型平民化开启“AI+医疗”新纪元 国联民生证券医药研究团队 请务必阅读报告末页的重要声明 2025年03月07日 投资要点 ➢ 2025年有望成为“AI+医疗”元年:DeepSeek的出现标志着算力成本的大幅降低,大模型平民化时代有望到来,AI产业 逻辑从算力往应用端全面延伸。医疗板块具备较强AI应用挖掘潜力,一方面是很多细分产业会产生较多具备分析价值 个性化用药、健康数据追踪等; • B2C远程管理:C端患者和B端医疗机构脱离线下场景,实现远程互动,如远程影像、远程病理等; • B2C临床管理:AI赋能B端医疗机构的临床决策,如AI医生、院内大模型等; • B端自我管理:B端医疗机构利用AI工具提高内部运营效率,如电子病历、HIS系统、病床管理、供应链管理等。 ➢ 投资建议: ➢ 硬件+AI:测序设备公司(华大智造等)、影像设备公司( 性事件是以OpenAI的GPT-4为代表的大型语言模型(LLM)首次亮相,展 现出强大的自然语言处理能力,能够进行创意写作、编码和复杂问题解决,因此2023年被认为是生成式AI的元年,随后又有多模态大模 型的突破(文生视频模型SORA)、算力提升、端侧应用等又进一步加强了AI的逻辑。 ➢ 路径不同:美股的AI代表性公司(以英伟达为例)股价持续上涨,基本面和预期相互促进;国内AI相关公司(以寒武纪-U为例)从202410 积分 | 85 页 | 5.92 MB | 6 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页AI 大模型需要什么样的硬件? 华泰研究 电子 增持 (维持) 研究员 黄乐平,PhD SAC No. S0570521050001 SFC No. AUZ066 leping.huang@htsc.com +(852) 3658 6000 研究员 胡宇舟 SAC No. S0570523070005 S0570523070005 SFC No. BOB674 huyuzhou@htsc.com +(852) 3658 6000 研究员 黄礼悦 SAC No. S0570523070007 SFC No. BRH099 andrewhuang@htsc.com +(86) 21 2897 2228 联系人 权鹤阳 SAC No. S0570122070045 华泰观点:关注 AI 大模型 x 硬件的两条思路 从 22 年 11 月 OpenAI 推出 ChatGPT 至今,我们看到 Chatbot 应用的能力 不断增强,从最初的文字问答,迅速向具有自主记忆、推理、规划和执行的 全自动能力的 AI Agent 发展。我们认为端侧智能是大模型发展的重要分支。 建议投资人沿着:1)大模型如何赋能终端,2)终端如何解决大模型普及难 点两条思路,寻找硬件的落地机会。我们看好10 积分 | 40 页 | 2.60 MB | 6 月前3
2025年智启未来·险见新机-人保寿险大模型探索及实践(33页 PPT)智启未来 · 险见新机 —— 人保寿险大模型探索及实践 中国人民人寿保险股份有限公司 呼群 01 公司简介 02 大模型 技术探索 大模型 实践应用 目 录 03 2 保险、年金保险、健康保险、意外伤害保险等保险业务及其再保险业务。公司总部设在北京 ,机构网点布局完善, 在全国 31 个省、 自治区、直辖市和 5 个计划单列市设立 36 个省级分公司。 下拥 网点机构 ,覆盖全国城 乡 公司简介 3 01 公司简介 02 大模型 技术探索 大模型 实践应用 目 录 03 4 人工智能发展历程 5 规模到达临界点之后才会迅速增长 GPT-4 模型参数: 1.8 万亿参数 典型的新技能学习曲线 摘自北京大学 AI 肖睿团队团队作品 大模型参数变化三个阶段 摘自复旦大学大数据教学团队作品 智慧涌现的关键 6 智能用数:支持复杂库表情况下的查询与分析作业,自助取数、经营分析 • 智能开发:需求助手、编码助手、测试助手、运维助手 7 大模型的 “快思”与 “慢想” = “ 通用” + “ 推理”模型 金融机构的大模型策略 ,应结合快思考 + 慢思考两种模式的模型 ,根据场景功能点对模型能力的要求 ,发挥不同模式模型的优 势 在人工智能语境下, “ 问行合一 ”是指一种高效的人机交互理念,10 积分 | 33 页 | 2.82 MB | 2 天前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求电子 AI+ 系列专题报告 Deep Seek 重 塑 开 源 大 模 型 生 态 , A I 应 用 爆 发 持 续 推 升 算 力 需 求 证券分析师:胡剑 证券分析师:胡慧 证券分析师:叶子 证券分析师:张大为 证券分析师:詹浏洋 021-60893306 021-60871321 0755-81982153 021-61761072 010-88005307 hujian1@guosen S0980524100002 S0980524060001 l DeepSeek 发展突飞猛进,领跑开源大模型技术与生态, DeepSeek 模型已成为全球现象级模型。 DeepSeek( 深度求索 ) 公司成立于 2023 年 7 月,是一家致力 于实现 通用人工智能 (AGI) 的创新型科技公司。 与监督式微调、全场景强化学习等。 l AI 应用爆发在即,算力需求持续攀升,关注 ASIC 及服务器产业链。 Scaling Law 与“涌现”能力是大模型训练遵循的重要法则,随着 ChatGPT 引领全球 AI 浪潮, 国内外科技公司纷纷发布 AI 大模型,截至 24 年 7 月,全球 AI 大模型数量约 1328 个 ( 其中美国位居第一位,占比 44% ;中国位居第二位,占比 36%) ,模型的 迭代加速、 竞争加剧。同时,10 积分 | 38 页 | 1.95 MB | 6 月前3
2025面向工程审计行业的DeepSeek大模型应用指南-南京审计大学工程审计学院(45页 WORD)面向工程审计行业的 DeepSeek 大模型应用指南 ( Version 1.0) 南京审计大学 工程审计学院 公共工程审计江苏省高校重点实验室 复杂工程审计与治理研究院 工程项目智能化审计团队 2025 年 3 月 2 日 前 言 “ 在数智化转型时代背景下,工程审计正面临 数据爆炸、场景复杂、标准多 ” 元 的严峻挑战。传统工程审计模式依赖人工抽样与经验判断,难以应对海量工 审 计智能化转型迫在眉睫。 DeepSeek 大模型作为自主可控的新一代人工智能大模型,凭借多模态理解、 动态推理与领域自适应能力,能够为工程审计的效率提升提供支持。本指南 (V1.0) 旨在系统化阐明 DeepSeek 大模型在工程审计中的核心价值与应用路 径,推动工 程审计行业的智能化转型。 作为 DeepSeek 大模型在工程审计领域的行业级参考指南与公益知识库,本 在此向以下贡献者 致以专业致谢: 审计行业专家提供的领域知识框架; 开源社区共享的 AI 工程化实践经验; 学术机构发布的跨学科研究成果。 我们期待与行业同仁持续共建 DeepSeek 大模型在工程审计领域的知识生态 体系,推动工程审计智能化技术的普惠化发展。 本指南(V1.0)开放接受学术共同体与行业实践者的应用反馈,诚邀各界同 仁参与共建,相关建议请致函编写团队老师(邮箱为:yqmei@nau10 积分 | 59 页 | 1.06 MB | 2 天前3
电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页请务必阅读正文之后的免责声明及其项下所有内容 证券研究报告 | 2023年05月31日 超 配 电子 AI+系列专题报告 边缘 AI:大语言模型的终端部署,推动新一轮终端需求 核心观点 行业研究·行业专题 电子 超配·维持评级 证券分析师:胡剑 证券分析师:胡慧 021-60893306 021-60871321 hujian1@guosen.com.cn huhui2@guosen 《电子行业周报-在行业周期筑底阶段无需过度悲观》 —— 2023-05-08 大模型参数量级飞涨,相应训练集需同比提升。李开复定义 AI 2.0 时代的 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 大模型增长挑战芯片算力和内存,无法实现完整端侧部署。大模型训练和推 理的三大瓶颈是算力、显存和通信,根据我们的测算,算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度,10 积分 | 25 页 | 2.20 MB | 6 月前3
清华大学:DeepSeek赋能家庭教育“能力培养者 ”,注重培养孩子的 综合素质。 • 家长应为孩子提供实践机会,鼓励 孩子独立思考和解决问题 ,而不是 仅仅关注孩子的考试成绩。 家长的两大疑问 1.“ 孩子会不会因此变懒? ” 2.“A I 会不会影响孩子的独立思考能力? ” 家长行动指南: 1. 设定边界: 明确 AI 工具使用场景(如仅用于思路 拓展而非作业代劳) 器人比爸爸更懂我 " , 亲子关系出现严 重 裂痕 l 在 AI 系统中设置「情感急救通 道」 l 家长每日查看情绪分析报告 l 每月预留 2 次「系统失效日」 家长可能陷入的四大误区 A I 时代家长需要具备的核心技能 1. 学习策略设计者 • 家长帮助制定科学合理的学习计划。 • 家长需要根据孩子的反馈和学习效果 及时调整策略。 2. A I 帮助学习者从具 备单 一技能状态发展到拥 有多个 成熟技能。 Ø 整合各种领域的知识, 为 学 习者提供更广泛的学习资 源, 帮助其掌握多种技能。 教育大模型: 四能跃升 认知突 围 操作 DeepSeek 提示词 构建「专属家教」 的四大核心要素 • 精准画像: 为孩子绘制“ 成长地图 • 弱点克星: 做孩子的“ 成长医生 ” • 灵活调整: 会“ 呼吸 ”的学习伴侣 •10 积分 | 89 页 | 9.10 MB | 5 月前3
2025年分布式调相机对大规模新能源汇集到的支撑作用探讨报告20 积分 | 33 页 | 3.71 MB | 2 天前3
共 67 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7
