积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部研究报告(17)人工智能(17)

语言

全部中文(简体)(16)

格式

全部PDF文档 PDF(16)PPT文档 PPT(1)
 
本次搜索耗时 0.027 秒,为您找到相关结果约 17 个.
  • 全部
  • 研究报告
  • 人工智能
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 化工DeepSeek时刻到了吗,化工龙头是否会重估?

    本周化工市场综述 关于 DeepSeek,我们认为其对于大化工产业的竞争要素和商业模式可能会产生深远影响,具体到大化工各环节, 我们认为其对于设备、设计、筛选、流程优化,具体到投资方向,我们看好合成生物、农药创制药、新材料以及设备 端的投资机会。本周众多化工品涨价,比如:有机硅、香兰素、炭黑、金属铬、涤纶长丝、钾肥,我们继续看好金三 银四化工品涨价投资机会,具体到涨价品种排序,我们认为政策驱 图表 21: 聚丙烯-丙烯(元/吨) ................................................................. 14 图表 22: 合成氨价差(元/吨) .................................................................. 14 图表 23: 顺丁橡胶-丁二烯(元/吨) 足,煤炭市场价格承压下行;本周甲醇价格大体平稳,传统下游需求陆续恢复,市场需求 端稍有向好,但贸易商出货提升,产品价格仍处于上下游博弈;合成氨市场供需氛围好转, 节后厂家陆续排库完成,出货及库存压力多不大,且受陕西、宁夏、河南、山东及两湖等 地减量支撑,合成氨价格联动上调,但随着各地价格持续挺涨,下游抵触情绪渐生,场内 观望情绪不减。  化肥 一铵主流工厂报价持稳,主发前期订单;个别小厂挺价心态较浓厚,试探上调报价,幅度
    0 积分 | 22 页 | 2.66 MB | 9 月前
    3
  • pdf文档 人形机器人生态报告2025-上海财经大学

    ⽉联合发布 GraspVLA,采⽤“VLM ⻣⼲+动作专家”架构,通过 渐进式动作⽣成连接。“⼤脑”含 InternLM2 1.8B 及融合双模型特征的视觉编码器;“⼩ 脑”专注动作块⽣成。经 10 亿级合成数据预训练获七⼤泛化能⼒,⼩样本真机后训练 可应⽤于特殊场景。智元机器⼈ 2025 年 3 ⽉发布 ViLLA 架构的 GO-1 模型,构建 “VLM+MoE 混合专家”体系。“⼤脑”由 InternVL-2B(多模态感知)与 务,为机器⼈本体开发商与应⽤开发商补⻬关键的软件能⼒;华为推出的 CloudRobo 具⾝智能平台依托云端海量算⼒与先进 AI 模型,整合训练数据⽣成、云上环境感知、 全局规划、⾃主执⾏等能⼒,⽀持真机实采与合成数据训练;智元机器⼈发布的 Genie Studio 作为⾏业⾸款⼀站式开发平台,覆盖数据采集、模型训练、仿真评测、模型推 理全链路,拥有 6000+物体资产与仿真场景,⼤幅降低开发⻔槛;松应科技推出的 是宇树科技跨多类机器⼈本体的开源世界模型-动作架构,专为 通⽤机器⼈学习⽽设计。其核⼼成分在于⼀个可以理解机器⼈与环境交互物理规律的 世界模型。该世界模型具备两个核⼼功能:仿真引擎,作为交互式仿真器运⾏,为机 器⼈学习提供合成数据;策略增强,可与⼀个动作头进⾏对接,通过预测未来与物理 世界的交互过程,进⼀步优化决策性能。 3.2.2 星动纪元 星动纪元成⽴于 2023 年,由清华⼤学交叉信息研究院孵化,是清华⼤学占股的⼈
    10 积分 | 20 页 | 2.65 MB | 1 月前
    3
  • ppt文档 北大:DeepSeek-R1及类强推理模型开发解读

    Takeaways PRM & MCTS 的作用 从文本模态到多模态 其他讨论: Over-Thinking 过度思考等 未来方向分析探讨 模态穿透赋能推理边界拓展: Align-DS-V 合成数据及 Test-Time Scaling: 突破数据再生产陷阱 强推理下的安全:形式化验证 Formal Verification \ 审计对齐 Deliberative Alignment 26 低成本高质量语言模型边界的探索,扩展的具体方法和侧重点改变:最初是模型规模, 然后是数据集规模,现在是推理时的计算资源和合成数据; 垂直领域和横向拓展:采用 "API+ 本地化知识库 " 或 " 提示工程 + 检索增强 " 的混合方 案, 通过 Prompt Engineering 和 RAG 等技术实现业务场景的快速适配与轻量定制, 力的位置猜测任务;以及涉及复杂图表理解的数据分析任务等。这些数据集提升了模型在真实世界场景中的 视 觉推理能力。 合成视觉推理数据 是人工生成的,包括程序化创建的图像和场景,旨在提高特定的视觉推理技能,例如理解 空间关系、几何模式和物体交互。这些合成数据集提供了可控环境,用于测试模型的视觉推理能力,并且可 以 无限生成训练样本。 文本渲染数据 是通过将文本内
    10 积分 | 76 页 | 6.72 MB | 9 月前
    3
  • pdf文档 2025具身机器人行业未来展望报告

    GraspVLA 04 17 资料来源:银河通用公众号,浙商证券产业研究院 2025年1月,银河通用发布抓取基础大模型GraspVLA。GraspLVA的训练包括预训练及后训练。其中预训练完全基于合成大数据,训练数据 达到了有史以来最大的数据体量——十亿帧「视觉-语言-动作」对,掌握泛化闭环抓取能力、达成基础模型;预训练后,模型可直接 Sim2Real 在未见过的、千变万化的真实场景和物体上 模型。视觉-语言模块(系统 2)通过视觉和语言指令来理解环境。随后的扩散转换器模块(系统 1)实时生成流 畅的运动动作。这两个模块紧密耦合,并进行端到端联合训练。英伟达使用真实机器人轨迹、人类视频和合成生成的数据集的异构混合物来 训练 GR00T N1,解决了具身智能所面临的数据稀缺和多样性不足的问题,从而提升机器人在复杂环境中的操作能力。英伟达表示,GR00T N1 在多个机器人实施例的标准模拟基准上优于最先进的模仿学习基线。 数据金字塔,整合异构数据源,构建覆盖不同抽象层次的训练数据体系。这个数据金字 塔共分为三层:(1)大量网络数据和人类视频构成金字塔的底层;(2)通过物理模拟生成和 / 或借助现成神经模型增强得到的合成数据形 成中间层;(3)在实体机器人硬件上收集的真实世界数据则构成顶层。金字塔的底层提供广泛的视觉和行为先验知识,而顶层确保模型能在 实体机器人执行任务时落地应用。 底层:来自互联网及人类活动的视频。其特点是数量多成本低。特点是通
    0 积分 | 31 页 | 3.33 MB | 8 月前
    3
  • pdf文档 2025年DeepSeek手册:DeepSeek给我们带来的创业机会

    我们对大模型发展趋势的十大预判 13 政企、创业者必读 14 DeepSeek出现之前的十大预判 之一 传统AGI发展步伐在放慢 需要寻找新方向  Scaling Law边际效应递减  人类训练数据接近枯竭  合成数据无法创造新知识  推理能力难以泛化,成本高昂 全面超越人类的人工智能在逻辑上不成立 政企、创业者必读 15 DeepSeek出现之前的十大预判 之二 慢思考成为新的发展模式  大模 大模型进入「轻量化」时代,上车上终端,蒸馏小模型  先做得更大,然后探索能做多小 政企、创业者必读 DeepSeek出现之前的十大预判 之五 知识的质量和密度决定大模型能力  高质量数据、合成数据使模型知识密度的快速增长  大模型能以更少的参数量达到更高的性能  360联合北大研发:5%参数量逼近Deepseek-R1满血性能 18 政企、创业者必读 DeepSeek出现之前的十大预判 Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后,继续增大参数规 模难以带来质的提升 • 训练算力成本和工程化难度大幅上升 强化学习Scaling Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习,在不增大参 数规模前提下,大幅提升复杂推理能力 • 通过后训练算力和推理算力,在不增加 预训练算力前提下,大幅提升模型性能 DeepSeek颠覆式创新——技术创新
    10 积分 | 76 页 | 5.02 MB | 9 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    来源:艾瑞咨询研究院自主研究绘制。 在语音识别能力方面,ASR模型数据量和参数量逐步增大,且大模型可为ASR提供上下文内容理解,在识别率、说话人分离、多方言覆盖 等方面继续进行有效提升;在语音合成能力上,基于AI语音设计、AI音乐创作等技术方向,音频能力正由被动生成发展到主动创作;在语 音交互能力上,更多厂商在语音大模型架构中,可由ASR-LLM-TTS的级联式架构升级为端到端的语音交互大模型,显著提升人机语音交互 3 AI语音演进方向 语音识别 (ASR)) 大语言模型 (LLM) 语音合成 (TTS) 第一代语音大模型:级联式架构 第二代语音大模型:端到端的语音交互模型 语音分词器 大语言模型 语音合成器 将连续的音频信号编 码为离散的token 对token展开 自回归建模 将生成的token合成 为语音波形 由文本生成声音 AI声音克隆:音色复制 AI声音设计/转换:在语言/声音基础上 来源:艾瑞咨询研究院自主研究绘制。 大模型应用层 字节跳动人工智能产品矩阵 基础大模型 大模型开发平台 智能体开发平台 豆包大模型1.5 pro 大语言模型 豆包1.5 视觉理解模型 多模态大模型 豆包·语音合成模型 语音大模型 豆包·视频生成模型 视觉大模型 豆包·声音复刻模型 语音大模型 豆包·角色扮演模型 大语言模型 … … 一站式大模型开发平台 以自研豆包系列为主,包含大语言模型、多模态模
    0 积分 | 51 页 | 3.35 MB | 9 月前
    3
  • pdf文档 2024年中国人工智能产业研究报告

    来源:艾瑞咨询研究院自主研究绘制。 在语音识别能力方面,ASR模型数据量和参数量逐步增大,且大模型可为ASR提供上下文内容理解,在识别率、说话人分离、多方言覆盖 等方面继续进行有效提升;在语音合成能力上,基于AI语音设计、AI音乐创作等技术方向,音频能力正由被动生成发展到主动创作;在语 音交互能力上,更多厂商在语音大模型架构中,可由ASR-LLM-TTS的级联式架构升级为端到端的语音交互大模型,显著提升人机语音交互 3 AI语音演进方向 语音识别 (ASR)) 大语言模型 (LLM) 语音合成 (TTS) 第一代语音大模型:级联式架构 第二代语音大模型:端到端的语音交互模型 语音分词器 大语言模型 语音合成器 将连续的音频信号编 码为离散的token 对token展开 自回归建模 将生成的token合成 为语音波形 由文本生成声音 AI声音克隆:音色复制 AI声音设计/转换:在语言/声音基础上 来源:艾瑞咨询研究院自主研究绘制。 大模型应用层 字节跳动人工智能产品矩阵 基础大模型 大模型开发平台 智能体开发平台 豆包大模型1.5 pro 大语言模型 豆包1.5 视觉理解模型 多模态大模型 豆包·语音合成模型 语音大模型 豆包·视频生成模型 视觉大模型 豆包·声音复刻模型 语音大模型 豆包·角色扮演模型 大语言模型 … … 一站式大模型开发平台 以自研豆包系列为主,包含大语言模型、多模态模
    10 积分 | 51 页 | 3.35 MB | 9 月前
    3
  • pdf文档 国元证券-汽车智能驾驶行业深度报告:端到端与AI共振,智驾平权开启新时代

    块,进一步提升了复杂场景下的环境理解和决策能力。 Pipeline架构 MontionFormer Planner OccFormer 请务必阅读正文之后的免责条款部分 强化学习(RL) 策略蒸馏 多模态/先进结构 合成数据 模仿学习(IL) 条件模仿学习 泛化 可解释性 策略预训练 模块化端到端 图4:端到端发展历程 资料来源:Chen L, Wu P, Chitta K,et al,End-to-end Autonomous 证结果难以完全反映真 实情况。因此,调整长尾场景在训练数据中的分布比例有很大的探索价值。目前的普遍解决方案是采用合成数据来模 拟真实世界数据的特征分布。合成数据能够以较低成本增加训练数据的规模、丰富泛化场景的多样性,并有效生成长 尾场景。例如,英伟达通过其Omniverse平台,利用合成数据提升模型对复杂场景的适应性。此外,特斯拉也采用合 成数据生成边缘场景来扩充数据集,通过迭代方法捕捉更多边缘情况。 、极氪、岚图、东风、零跑、广汽、长城、 智己、宝骏等20多家车企及供应商陆续宣布与DeepSeek大模型完成深度融合。 请务必阅读正文之后的免责条款部分 图9:DeepSeek大模型的优势:数据合成与增强 资料来源:焉知人形机器人,国元证券研究所 车企抢滩DeepSeek,AI行业与智能驾驶共振 14 以Deepseek为代表的AI技术进步助推自 动驾驶行业告别硬件堆叠、算力比拼, 一场以AI融合为核心的高阶智能驾驶和
    10 积分 | 95 页 | 6.54 MB | 9 月前
    3
  • pdf文档 北京金融科技产业联盟:2025年数字孪生技术金融应用研究报告

    基于数字孪生技术的虚拟网点逻辑架构 (二)数字人 1.应用场景概述 数字人技术目前已大量应用于金融产品营销、金融业务 办理等场景,通过创建高保真的数字人形象,借助计算机图 形学、图形渲染、深度学习、动作捕捉、语音识别及合成等 人工智能技术,虚拟数字人可以对物理世界进行感知并通过 电子屏、VR/AR 等设备与物理世界进行交互,为客户介绍金 融产品,提供金融投顾、金融投资者教育等服务,降低人员 成本的同时,提升服务效率,强化合规管理。 身可基于人体扫描或手工建模的方式获取数字人所需的人 体形状和外观信息,设定文本驱动、视频驱动、语音驱动等 多种驱动方式,结合音视频通讯技术,通过渲染引擎合成显 示数字人。 在交互能力方面,通过语音识别技术,结合大语言模型, 进行语音合成、多轮对话等生成,同时,支持文本、语音、 图像等多模态信息人机交互方式。 在应用实现方面,针对交互式数字人和播报式数字人, 需要区分不同的应用架构。在部署设计中,需要考虑高可用、
    10 积分 | 53 页 | 2.07 MB | 9 月前
    3
  • pdf文档 火山引擎&IDC:2024年中国企业多云战略白皮书

    服务。此外,全球网络POP (Point of Presence,接入点)覆盖范围对企业也非常重要,同时,在企业 时延优化、并行存储吞吐率以及实时性能监控等指标上也具有相应的需求。 AI算力综合成本:市场需要灵活的资源配置规格和计费模式,云服务商需要 支持多种配置策略,提供高效的弹性伸缩,并通过技术创新提升硬件资源共 享效率和利用率,降低计算和存储成本。 �� AI工具链:支持传统A 积极探索、审慎实践多云战略 多云战略可以帮助一些企业有效分散风险、灵活调配资源、避免厂商绑定,在降 低综合成本的同时获取到不同云服务商的独特技术优势,在采用得当的情况下, 可以为这些企业带来增量价值。但每个企业在选择多云时均应审慎对待,综合评 估自身发展现状、业务需求变化、综合成本构成和新技术发展趋势等要素,把握 好多云建设、资源再分配、数据迁移、应用重构的时机,力求最大化赋能业务创
    0 积分 | 56 页 | 1.97 MB | 9 月前
    3
共 17 条
  • 1
  • 2
前往
页
相关搜索词
化工DeepSeek时刻龙头是否重估人形机器机器人生态报告2025上海财经大学上海财经大学北大R1及类推理模型推理模型开发解读具身行业未来展望手册我们带来创业机会2024中国人工智能人工智能产业研究国元证券汽车驾驶深度端到AI共振智驾平权开启时代北京金融科技科技产业联盟数字孪生技术应用火山引擎IDC企业多云战略白皮皮书白皮书
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 - 2026 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩