积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部研究报告(12)区域研究(12)

语言

全部中文(简体)(4)

格式

全部PDF文档 PDF(6)PPT文档 PPT(4)DOC文档 DOC(2)
 
本次搜索耗时 0.026 秒,为您找到相关结果约 12 个.
  • 全部
  • 研究报告
  • 区域研究
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页

    大模型参数量级飞涨,相应训练集需同比提升。李开复定义 AI 2.0 时代的 特征是通过海量数据,无需标注自监督学习,训练一个基础大模型,并在各 领域将其专业化。据相关论文,当模型的参数量大于某阈值,会展现出类似 推理、无监督学习等未曾出现的能力,这种现象被称为“涌现”,因此目前 大语言模型参数均在十亿量级以上。同时,Deepmind 研究表明,模型参数的 上涨需要配合等比例上升的优质数据集来达到最佳训练效果。因此,大模型 参数在十亿级以上发展并受限于优质数据集的增速是 AI 发展的必然趋势。 大模型增长挑战芯片算力和内存,无法实现完整端侧部署。大模型训练和推 理的三大瓶颈是算力、显存和通信,根据我们的测算,算力方面 GPT-3 训练 所需算力为 121528 TFLOPS,若 30 天内完成,需要 1558 颗 A100。内存角度, GPT-3 训练至少需要 3.2T 内存,至少 44 张 A100,推理任务则主要受显存限 制,需要 4 至 8 张 百亿参数大模型具备涌现能力,训练数据需等比例提升 .............................. 5 大模型的参数下限:AI2.0 时代,基础大模型参数指数级增长 ................................ 5 大模型的参数上限:参数的增加需要同等量级的训练集增加 .................................. 6 大模型训练对硬件的挑战:算力、内存和通信
    0 积分 | 25 页 | 2.20 MB | 6 月前
    3
  • ppt文档 电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求

    通用人工智能 (AGI) 的创新型科技公司。 2024 年 12 月, DeepSeek-V3 发布,性能对齐海外领军闭源模型。据官方技术论文披露, V3 模型的总训练成本 为 557.6 万美元, 对比 GPT-4o 等模型的训练成本约为 1 亿美元。 2025 年 1 月, DeepSeek-R1 发布,性能对标 OpenAI-o1 正式版。在数学、代码、 自然 语言推理等任务上,性能比肩 云团队联合首发并上线基于华为云昇腾云服务 的 DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE 实现高效的推理和低成本训练,构建 DualPipe 算法和混合精度训练优化计算与通信负载;通过 ( 分阶段 ) 强化学习实现 性能突破。 多头潜在注意力 (MLA) 通过低秩联合压缩技术,大幅削减了注意力键 (keys) 和值 (values) DualPipe 算法,通过优化计算与通信的重叠,有效减少了流水线中的空闲时间。采用 FP8 混合精 度训练技术,不仅极大地加快 了训练速度,还大幅降低了 GPU 内存的消耗。 DeepSeek-R1-Zero 通过强化学习架构创新实现突破性性能,核心技术创新体现在训 练效能优化策略、双维度评价体系、 结构化训练范式三个维度。 DeepSeek-R1 采用分阶段强化学习架构演进,包括冷启动阶段、面向推理的强化学习、拒绝采样
    0 积分 | 38 页 | 1.95 MB | 6 月前
    3
  • ppt文档 电子AI+系列专题:复盘英伟达的AI发展之路

    S0980522090001 l GPU 是人工智能时代下满足深度学习大量计算需求的核心 AI 芯片。 过去五年,大型语言模型的参数规模以指数级增长;从 2018 年起, OpenAI 开始发布生成式预训练语言模型 GPT 以来, GPT 更新换代持续提升模型 及参数规 模; 2022 年 12 月, OpenAI 发布基于 GPT-3.5 的聊天机器人模型 ChatGPT ,参数量达到 1750 亿个。 亿元增长至 2024 年的 785 亿元,对应 CAGR 达 45.11% 。 AI 芯片中 由于 GPU 通用型强,满足深度学习大量计算 的需求,因此 GPU 在训练负载中具有绝对优势。以 GPT-3 为例,在 32 位的单精度浮点数数据下,训练 阶段所需 GPU 数量为 1558 个,谷歌级应用推理阶段所 需 GPU 数量为 706315 个。 l 英伟达开辟 GPGPU 加速计算格局, GPU 566.7 万个,对应 CAGR 达 18.60% ;其中,云数据中心负载任务量 CAGR 预计达 22% 。 l 以模型中的参数数量衡量,大型语言模型的参数 在过去五年中以指数级增长。随着参数量和训练 数据量的增大,语言模型的能力会随着参数量的指 数增长而线性增长,这种现象被称为 Scaling Law 。 但当模型的参数量大于一定程度的时候,模 型能力 会突然暴涨 ,模型会突然拥有一些突
    0 积分 | 30 页 | 1.27 MB | 6 月前
    3
  • pdf文档 电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域

    , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 小模型,其中32B和70B模型在多项能力上实现对标OpenAI 过推出高性能、低成本且开源的模型,DeepSeek给全球AI发展带来了模 型平权,同时也将刺激其他头部模型厂商加快推出性能更强、成本更具 竞争力的模型。而随着模型调用门槛降低,AI终端有望加速落地,而AI+ 快速发展也将反哺训练算力、推理算力需求。  AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型 Qwen2.5-72B 和 Llama-3.1-405B 等开源模型,并在性能上和 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲,训练成本仅约为 558 万美元。1 月 20 日,DeepSeek 开源 R1 模型,后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下, 极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
    0 积分 | 23 页 | 2.65 MB | 6 月前
    3
  • pdf文档 电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页

    Brilliant Monocle ChatGPT 语音助手 Ray-Ban Meta Meta AI AI助理 场景识别 翻译 李未可Meta Lens S3 大语言模型AI系统 语音助手 翻译/口语训练 行程安排 MYVU Flyme AI(基于开源模型) 语音助手 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 13 电子 大模型应用#2:生产力工具的 AI 升 级了 Issac 机器人平台,从训练、仿真、推理三方面赋能机器人行业发展。在自动驾驶方面, 英伟达同样也推出了 Drive 平台。 1) 训练平台:用于训练机器人的基础模型。包含英伟达推出的“Project GR00T”人形机 器人通用模型、以及其他主流的 VLM/LLM 等生成式 AI 通用基础模型,可以在此基础 上进行感知、决策、规控等方面训练和强化学习。 2) 仿真平台:在 Omniverse Foundations;国内,阿里、百度、字节跳动、腾讯等公司均推出了基于自有云服务 的 MaaS 模式,商汤等公司也推出了基于自有 AIDC 和大模型能力的 MaaS 服务。其中, 大模型的来源包括厂商自身训练的闭源模型和开源模型,以及第三方开源模型。以微软 Azure 为例,用户可选择 OpenAI 的闭源模型,微软自己的开源模型 Phi 系列,以及 Llama 等第三方开源模型。 图表23: 大模型服务(Model
    0 积分 | 40 页 | 2.60 MB | 6 月前
    3
  • pdf文档 电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页

    示学习和人工反馈的强化学习(RLHF)来指导模型训练。模型可理解并生成对各种主 题的类似人类的响应,是 AIGC 技术进展的成果。2023 年 3 月 15 日,OpenAI 正式官宣 了多模态大模型 GPT-4,ChatGPT4 将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。 表1:历代 GPT 表现情况 模型 发布时间 参数量 预训练数据量 Tokens 媒与计算机侧重于落地应用。基础设施层核心的 AI 芯片产业是高技术壁垒行业,目前 主要由英伟达垄断,我国与海外市场差距较为明显,短板突出且需要时间成本投入;算 法层存在一定机会,但由于模型的训练是一项长回报周期、高资金投入的工作,最终市 场将呈现马太效应,会由少数大厂具备通用大模型能力,并朝着基础设施的方向演化。 电子硬件作为承载应用的终端载体,在各类创新应用发展的推动下,将迎来需求的增长。 可以为任何图像或者视频中的任何物体生产 mask,甚至包括在训练过程中没有遇到过 的物体和图像类型。SAM 足够通用,可以涵盖广泛的场景,并且可以在新的图像领域 上即开即用,无需额外的训练。SAM 模型将为 AIGC 应用打开新的应用空间。通过研 究和数据集共享,Meta 希望进一步加速对图像分割以及更通用图像与视频理解的研究。 Meta 预计,与专门为一组固定任务训练的系统相比,基于 prompt 工程等技术的可组合
    0 积分 | 28 页 | 2.68 MB | 6 月前
    3
  • ppt文档 数字服务与数字运营的市场现状报告

    零售长尾客户 经营解决方案 数字客户经营 平台建设咨询 企微私域运营 管理咨询 共创案例——人工智能训练森林话术萃取 咨询解决方案 - (森林技术) 话术森林萃取 专精 AI 知识库设计 个性化知识库 匹配知识维度 嵌入开发场景 模型定制训练 模型私有化 训练定制模型 “ 小模型”开发 专家话术萃取 头脑风暴共创 话术话素研究 四 色 话 术 凝 练 带 教
    60 积分 | 48 页 | 12.97 MB | 5 月前
    3
  • pdf文档 电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放

    据 DeepSeek 官网数据,DeepSeek-R1 在后训练阶段大规模使用了强化 学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App
    0 积分 | 4 页 | 269.47 KB | 6 月前
    3
  • ppt文档 各省市低空政策汇编

    300 元 / 架次的标准 给予补助, 每家 企业补助金额不超过企业上年度实际运营费用的 50%, 最高不超过 1000 万元。 2. 支持发展低空体育运动:鼓励企业投资建设一批高标准的航空运动训练基地 、比赛场地或飞行营地,对获国 家体育总局航管中心 、 中国航空运动协会授牌的, 给予一次性 50 万元奖励 。支持在我市举办航空运动比 赛 、 展览及飞行表演 、体验活动等, 获市级以上审批或批复的, 训、航空展览等特色新业态项目 。引进国内文旅头部企业,推动开通南昌空中旅游试点航线。培育“低空 + 体 育”消费需求, 加快在南昌航空城 、湾里景区等地布局建设滑翔伞飞行 、通航飞行 、无人机竞赛训练 基地, 打造国家级低空运动品牌 。发挥省内外头部企业优势,在南昌设立“航空运动数字体验中心” ,加大 开发各型 VR+ 低空运动等项目。 4. 城市治理: 充分应用北斗 、 5G 及“摄像头 用先行区 。 建成浙江省航空应急救援常态化区域备勤基地(金华), 满足浙中 、浙西森林防火救援 、 森林防灭火 、地 质灾害等救援需求 。推进浙江省应急救援基地建设, 结合金华市应急救援综合训练基地 建设, 组建全省首 个地市级无人机救援大队 。建设金华消防救援空勤培训基地, 建立航空救援员分级培 训认证体系 。建设金 华市警航实训实验基地, 提升无人机防御反制能力 。探索开展直升机共享服务。
    0 积分 | 169 页 | 1.24 MB | 5 月前
    3
  • pdf文档 服饰时尚行业数字化转型白皮书-百胜软件&Thoughtworks

    回归分析、时间序列分析、决策树、神经网络等对特征进行 建模和训练,进而根据不同的场景和需求,选择合适的算法 和模型结构来进行需求预测。在服饰时尚行业,季节性的影 响相对更为明显,数据的分析与挖掘意义也更为突出。 模型优化与应用:通过历史销售数据的分析,了解销售趋势、季节性波动和产品生命周期等模式,有助于为预测模型提供 基准和参考,同时可以发现异常和趋势变化;利用历史数据进行预测模型的训练,并通过交叉验证和模型评估方法来优化
    10 积分 | 39 页 | 14.97 MB | 6 月前
    3
共 12 条
  • 1
  • 2
前往
页
相关搜索词
电子行业电子行业AI系列专题边缘语言模型终端部署推动一轮新一轮需求20230531国信证券25DeepSeek重塑开源生态应用爆发持续推升算力复盘伟达发展深度报告平权关注及算力领域需要什么什么样硬件20240621华泰40降本增效降本增效拓宽落地场景丰富20230712东吴28数字服务运营市场现状R1加速进程看好潜力释放各省省市各省市低空政策汇编服饰时尚数字化转型白皮皮书白皮书百胜软件Thoughtworks
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩