积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部研究报告(5)区域研究(5)

语言

全部中文(简体)(1)

格式

全部PDF文档 PDF(4)PPT文档 PPT(1)
 
本次搜索耗时 0.013 秒,为您找到相关结果约 5 个.
  • 全部
  • 研究报告
  • 区域研究
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • ppt文档 电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求

    通过强化学习架构创新实现突破性性能,核心技术创新体现在训 练效能优化策略、双维度评价体系、 结构化训练范式三个维度。 DeepSeek-R1 采用分阶段强化学习架构演进,包括冷启动阶段、面向推理的强化学习、拒绝采样 与监督式微调、全场景强化学习等。 l AI 应用爆发在即,算力需求持续攀升,关注 ASIC 及服务器产业链。 Scaling Law 与“涌现”能力是大模型训练遵循的重要法则,随着 ChatGPT 引领全球 AI DeepSeek-V3 技术报告,国信证券经济研究所 整理 l DeepSeek-R1-Zero :通过强化学习架构创新实现突破性性能。该模型突破性地采用纯强化学习 (RL) 方法,未经过传统监督式微调 (SFT) 即达成卓越性能表现,在特定任务基准测 试中实现对 OpenAI-o1 的超越。其核心技术创新体现在三个维度: 1 )训练效能优化策略。创新性采用 GRPO( 群体相对策略优化 ) 示范数据进行模型初始化,有效缓解基础模型在初始训练阶段的波动性。 2 )面向推理的强化学习。和 DeepSeek-R1-Zero 方式相同,但引入了语 言一致性 奖励,对推理密集型任务进行特别优化。 3 )拒绝采样与监督式微调。使用已训练的 RL 模型来生成新的训练数据,通过构建推理数据和非推理数据提升模型的通用能力。 4 )全场景 强化学习。为了同时平衡推理能力和通用能力,将不同类型的奖励机制有机结合,再次进行强化学习。
    0 积分 | 38 页 | 1.95 MB | 6 月前
    3
  • pdf文档 电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页

    并在各个应用领域将其专业化。具体来说有三个特点:1)对于拥有的超级海量的 数据,无需进行人工标注,即进行自监督学习;2)基础模型规模非常大,参数规 模从十亿到千亿级别;3)训练出的基础模型具有跨领域知识,而后通过微调用降 低成本的方法来训练,以适应不同领域的任务。AI 2.0 的巨大跃迁之处在于,它 克服了前者单领域、多模型的限制。 图1:AI2.0 时代的特征是通过超级海量数据无需标注训练一个大模型 资料来源:创新工场,国信证券经济研究所整理
    0 积分 | 25 页 | 2.20 MB | 6 月前
    3
  • pdf文档 电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页

    表1:历代 GPT 表现情况 模型 发布时间 参数量 预训练数据量 Tokens 学习目标 GPT-1 2018 年 6 月 1.17 亿 约 5GB 1.3B 结合无监督学习及有监督的微调 GPT-2 2019 年 2 月 15 亿 40GB 15B 学习在无明确监督情况下执行多种任务 GPT-3 2020 年 5 月 1,750 亿 45TB 499B 结合少样本学习和无监督学习
    0 积分 | 28 页 | 2.68 MB | 6 月前
    3
  • pdf文档 智慧停车发展及智慧停车系统白皮书

    通信、智能停车场管理系统等技术。 改造之后的停车场,对于汽车驾驶员,可提供停车场厘米级 3D 找车位导航服务, 以及 AR 反向寻车服务;对于具备 APA(自动泊车辅助系统)和通信能力的自动驾驶 量产车型,场侧设备仅仅需要微调,便可提供 AVP 自动驾驶一键召泊车服务,为车主 提供了全新的出行方式。 图 5-2 长沙协作式智慧停车解决方案示意图 大学科技城和桃花岭景区停车场的车位检测数据纳入了湖南省的统一管理平台,
    10 积分 | 43 页 | 1.73 MB | 5 月前
    3
  • pdf文档 电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页

    亿美元,正式跃升为搜索引擎领域的独角兽。该搜索引擎产品主要搭载第三 方大模型,包括 GPT-4o、Claude-3、SonarLarge(LLaMa 3)、由开源的 Mistral-7b 和 Llama2-70b 模型微调、增强得到的 pplx-7b-online 和 pplx-70b-online,用户可以根据自己 的偏好选择使用的大模型。依靠检索增强生成技术(RAG),Perplexity AI 使大模型和外部
    0 积分 | 40 页 | 2.60 MB | 6 月前
    3
共 5 条
  • 1
前往
页
相关搜索词
电子AI系列专题DeepSeek重塑开源模型生态应用爆发持续推升算力需求行业电子行业边缘语言终端部署推动一轮新一轮20230531国信证券25深度报告降本增效降本增效拓宽硬件落地场景丰富20230712东吴28智慧停车发展系统白皮皮书白皮书需要什么什么样20240621华泰40
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩