2024年中国人工智能产业研究报告制”的模式。新兴商业模式为按应用效果或功能点收费,创新的模式可在降低客户采购决策成 本的同时,倒逼供应商持续优化产品技术与服务。 5)全球化战略:面对国内激烈竞争,众多企业积极出海,布局海外市场,在图像、视频和社交 等领域有较多突破。 6)DeepSeek掀起开源开放与应用落地的热潮:DeepSeek刷新了市场对大模型现阶段性能的 认知,其开源策略结合高效、低成本的架构显著加速了中国AI产业向更加高效、开放和自主的 其他事件,如AI换脸的诈骗事件 自己亲手用上了AI,… 妙鸭相机发布 GPT-4发布 Stable Diffusion、Midjourney… 文生视频Sora出现 AlphaGo击败围棋… ChatGPT发布 ChatGPT发布 AlphaGo击败围棋 世界冠军李世石 文生视频Sora出现 Stable Diffusion、Midjourney 等文生图产品发布 GPT-4发布 妙鸭相机发布 自己亲手用上了AI, 中国民众认为“AI到来的标志事件” 2.1% 5.2% 6.3% 9.6% 15.0% 27.7% 32.5% 48.8% 52.1% 代码编写类 汽车驾驶类 视频生成类 个人助理类 PPT制作类 信息检索类 视频处理类 图片生成类 文本写作类 2016年3月 2022年11月 2024年2月 2022年上半年 2023年4月 2023年7月 过去一年大家主要尝试过的AI功能0 积分 | 51 页 | 3.35 MB | 5 月前3
2024年中国人工智能产业研究报告制”的模式。新兴商业模式为按应用效果或功能点收费,创新的模式可在降低客户采购决策成 本的同时,倒逼供应商持续优化产品技术与服务。 5)全球化战略:面对国内激烈竞争,众多企业积极出海,布局海外市场,在图像、视频和社交 等领域有较多突破。 6)DeepSeek掀起开源开放与应用落地的热潮:DeepSeek刷新了市场对大模型现阶段性能的 认知,其开源策略结合高效、低成本的架构显著加速了中国AI产业向更加高效、开放和自主的 其他事件,如AI换脸的诈骗事件 自己亲手用上了AI,… 妙鸭相机发布 GPT-4发布 Stable Diffusion、Midjourney… 文生视频Sora出现 AlphaGo击败围棋… ChatGPT发布 ChatGPT发布 AlphaGo击败围棋 世界冠军李世石 文生视频Sora出现 Stable Diffusion、Midjourney 等文生图产品发布 GPT-4发布 妙鸭相机发布 自己亲手用上了AI, 中国民众认为“AI到来的标志事件” 2.1% 5.2% 6.3% 9.6% 15.0% 27.7% 32.5% 48.8% 52.1% 代码编写类 汽车驾驶类 视频生成类 个人助理类 PPT制作类 信息检索类 视频处理类 图片生成类 文本写作类 2016年3月 2022年11月 2024年2月 2022年上半年 2023年4月 2023年7月 过去一年大家主要尝试过的AI功能10 积分 | 51 页 | 3.35 MB | 6 月前3
2025具身机器人行业未来展望报告优势:数据可大规模获取,成本低 • 劣势:对仿真器要求高,仿真环境与真实世界存在差 异;迁移过程中存在性能下降 基于真实世界数据采集——直接从现实世界数据中学习, 包括本体采集、遥操作、动态捕捉、视频学习等方式。 • 优势:数据更真实可靠 • 劣势:数据少、泛化性差;通过机器本体和人采集, 成本高、难度大、效率低 国内外厂商 大模型进展 04 Partone 16 银河通用抓取基础大模型 MoE组成,其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力,MoE中的Latent Planner(隐式规 划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力,MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执 行能力,三者环环相扣,实现了可以利用人类视频学习,完成小样本快速泛化,降低了具身智能门槛,持续进化,将具身智能推上了一个新 台阶。 ViLLA通过预测Latent (VLA) 模型。视觉-语言模块(系统 2)通过视觉和语言指令来理解环境。随后的扩散转换器模块(系统 1)实时生成流 畅的运动动作。这两个模块紧密耦合,并进行端到端联合训练。英伟达使用真实机器人轨迹、人类视频和合成生成的数据集的异构混合物来 训练 GR00T N1,解决了具身智能所面临的数据稀缺和多样性不足的问题,从而提升机器人在复杂环境中的操作能力。英伟达表示,GR00T N1 在多个机器人实施0 积分 | 31 页 | 3.33 MB | 5 月前3
中国算力中心行业白皮书• 从算力中心的定制批发业务发展现状来看,需求端和供给端均展现出积极的发展态势。 ➢ 需求端,随着 AI 大模型的迅猛发展,市场对算力资源的需求呈现出快速增长。这一增长主要源于互联网大厂、云厂商、短视频厂商等行业头部企业 对高性能、大规模算力资源的投入持续增长,这一趋势推动了算力中心定制批发业务的高速发展。 ➢ 供给端,受益于新一轮技术升级,算力中心市场迎来更多整合契机。头部企业凭借在技术、资 水冷机组 精密空调 冷却塔 算力中心的主要设备 算力中心的内部结构 算力中心的定义与作用 资料来源: 灼识咨询 数据中心自互联网时代诞生以来,伴随科技的发展进步,在移动互联网、云计算、电商及短视频等行业的推动下 快速发展,而生成式AI的兴起正驱动其向重视计算效能与硬件配置的算力中心转型,为行业发展增添新动能。 9 数据中心发展历程 时代 背景 • 互联网初步兴起,中国 进入门户时代 下的核心驱动力 • 移动互联网高速发展, 微信、微博、移动支付 等应用贡献海量数据 • 云计算服务于09年起步 • 云计算技术成熟并普及, 15-21年间,云服务行业 迎来高速发展期 • 18年开始,短视频与直 播电商行业迅速崛起 • ChatGPT于22年12月推 出,AI对算力中心产业 形成初步影响 • AI技术取得突破性进展, 大模型与AIGC展现出巨 大的潜力和价值 代表性 需求方 关键10 积分 | 54 页 | 6.96 MB | 5 月前3
2025腾讯云城市峰会·上海站——从智能营销到智能制造大模型引擎 结合物联网和人工智能打造的勘探/安装/巡检一体化平台, 节约人力成本,降低安全风险,提高工作效率 当前拍摄 未来拍摄 屋顶四周对角 各处细节+视频 屋顶照片20多张 视频1段 VS 屋顶照片5-10张 视频1段 屋顶拍摄耗时 15-20分钟 2-5分钟 拍摄质量 容易造假 无死角,难造假 场景、节点 当前方案 未来改善 施工警示牌、安全防护,组件 铭牌、逆变器、并网箱、线缆 组织协同平台 5 6 区块链平台 设备运维(机) 5 组织人才(人) 1 0 先进 制造 智能制造(产) 供应链追溯(供) 数字营销(销) 智慧服务(服) 7 创新 科技 音视频平台 云原生体系 + + 敏捷 弹性 数据 智能 端到端价值链 客户需求 竞争环境 产业政策 颠覆技术 智能化 自动化 精益化 数字化 战 略 组 织 技 术 业 务 行业联合解决方案 400+ 生成式AI产品生态合作伙伴 1500+ 腾讯云计算 腾讯云存储 腾讯云网络 腾讯云分布式云 ⋯⋯ ⋯⋯ 腾讯云原生 CDN与边缘 腾讯云大数据 腾讯云数据库 腾讯云音视频 腾讯云智能 腾讯数字孪生 腾讯乐享 腾讯微卡 腾讯电子签 TAPD敏捷项目管理 腾讯会议 腾讯企点 ⋯⋯ 腾讯安全 数据管理与分析 精准营销与⽤户增⻓ 在线协作与培训 客户服务管理 ⻛险管理10 积分 | 16 页 | 16.40 MB | 5 月前3
2025年DeepSeek手册:DeepSeek给我们带来的创业机会从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 从生成式AI,发展到推理型AI 专家系统 感知AI 认知AI 生成式AI 多模态AI 推理式AI 9 政企、创业者必读 人工智能发展历程(二) 从单纯对话的大模型 国外:GPT-4等效智能在过去18个月内价格下降240倍 国内:大模型「亏本」卖,可以「白嫖」大模型API能力 19 政企、创业者必读 DeepSeek出现之前的十大预判 之七 多模态越来越重要 由文本生成迈向图像、视频、3D内容与世界模拟 多模态模态在能力变强的同时,规模正在变小 20 政企、创业者必读 21 DeepSeek出现之前的十大预判 之八 智能体推动大模型快速落地 能够调用各种工具,具有行动能力 未来产业 创意 能力 赋能企业 数转智改 数学计算 语义理解 逻辑推理 语言翻译 文本创作 自动驾驶 具身智能 1 2 4 5 知识问答 代码编程 文本生成 多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science 知识管理( 内部知识管理、 外部情报分析、10 积分 | 76 页 | 5.02 MB | 5 月前3
北京大学-DeepSeek原理和落地应用2025人工智能概念辨析 PART 01 大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具(国内) Ø DeepSeek、 豆包、Kimi、腾讯元宝、智谱清言、 通义千问、秘塔搜索、微信搜索... l 通用模型 Ø 大语言模型(LLM,Large Language Model) Ø 视觉模型(图片、视频) Ø 音频模型 Ø 多模态模型 Ø …… l 行业模型(垂直模型、垂类模型) 话、内容生成、翻译以及图文、音频、视频等信息处 理、生成、对话等。 侧重于复杂推理与逻辑能力,擅长数学、编程和自然语言推理任 务,适合高难度问题求解和专业领域应用。一般是在生成模型的 基础上通过RL方法强化CoT能力而来 推理能力 在日常语言任务中表现均衡,但在复杂逻辑推理(如 数学题求解)上准确率较低。 在复杂推理任务表现卓越,尤其擅长数学、代码推理任务。 多模态支持 支持文本、图像、音频乃至视频输入,可处理多种模10 积分 | 57 页 | 9.65 MB | 5 月前3
5G +AI投资策略研究报告博世安防系统 德国 综合 20.9 20 7% 5 5 安迅士 瑞典 综合 9.7 8 17% 6 6 菲利尔 美国 视频监控 7.8 8 1% 7 9 安朗杰 美国 门控 5.1 5 13% 8 8 韩华泰科 韩国 视频监控 4.9 5 -9% 9 11 天地伟业 中国 视频监控 4.5 3 32% 10 12 AVIGILON 加拿大 综合 4.1 4 17% 2010~2017年国内安防市场规模快速增长 写入2018年中央一号文,目标是2020年实现公共安全视频监控的“全域覆盖、全网共享、全时可用、全程可控” ,2020年会进入集中验收 期,考虑到半年以上的项目建设周期,相关项目订单有望提前到19年,驱动安防to G端需求高增长。 雪亮工程 项目目标 具体要求 全域覆盖 重点公共区域视频监控覆盖率达到100%,新建、改建高清摄像机 比例达到100%;重点行业、领域的重要部位视频监控覆盖率达到 100%,逐步增加高清摄像机的新建、改建数量 全网共享 重点公共区域视频监控联网率达到100%;重点行业、领域涉及公 共区域的视频图像资源联网率达到100% 全时可用 重点公共区域安装的视频监控摄像机完好率达到98%,重点行业、 领域安装的涉及公共区域的视频监控摄像机完好率达到95%,实现 视频图像信息的全天候应用 全程可控 公共安全视频监控系统联网应用的分层安全体系基本建成,实现重 要视频图像信息不失控,敏感视频图像信息不泄露 2.110 积分 | 206 页 | 10.47 MB | 5 月前3
火山引擎&IDC:2024年中国企业多云战略白皮书高,但集团处于统筹管理的需要,会考虑构建多云统一管理的平台,并对数 据进行一体化管理。 场景六:满足其他特殊要求。一些企业出于行业特殊性或技术发展要求,会 对特殊软件、硬件存在需求,例如对高性能计算服务、视频编解码等,因此 会选择多家云服务商,以满足业务发展、技术提升或合规要求。此外,一些 企业在面对临时性的突发业务需求时,也会考虑单独采购新的云服务。 �.� 多云战略为企业带来显著实践价值 使用效率,从而在运营优化的过程中不断获得新的增量收益。例如某流媒体 服务企业,接入多家云服务商的服务后,可根据价格、质量的变化情况,做 实时的动态调整。这些云服务商之间的数据目前尚无法交互,但其所承载的 同一类视频服务规模会由企业自研的多云管理平台进行动态管理。 多云环境加速云原生与AI等能力构建,助力企业构建跨平台灵活应用与智能 化升级:多云环境鼓励企业采用云原生技术和标准(如容器、Kubernetes、 未来的AI应用将普遍呈现多 模态特征,即在推动业务智能化的过程中,大模型需要全面支持对文本、图 像、视频等多种数据类型的处理,实现数据的理解、思考和转换。对于单模 态而言,通常自然语言生成类模型的训练一般需要GB到TB级别的数据,图像 生成类模型的训练需要TB到PB级别的数据,而音视频生成类模型则进一步将 数据需求量提升至PB乃至EB级别。多模态模型往往比单模态模型拥有更大的 容量,以0 积分 | 56 页 | 1.97 MB | 5 月前3
北京金融科技产业联盟:2025年数字孪生技术金融应用研究报告员、操作四类实体的数字模型,对真实网点进行仿真孪生。 基于数字网点,开通客户线上通道,客户即可进入虚拟 网点,虚拟网点通过语音识别、自然语言处理、视频图像分 析等技术,融合业务建模、深度学习、大数据分析等手段, 对业务办理、客户服务过程中产生的图片、语音、视频等非 结构化数据进行深度信息挖掘与分析,构建可以与客户完美 互动的虚拟网点环境(见图2)。 18 图 2 基于数字孪生技术的虚拟网点逻辑架构 过创新的服 务方式,吸引年轻客户,增强品牌竞争力。 (2) 支持远程服务 金融机构通过数字孪生技术创建的数字人,可以为客户 提供优质的远程服务,客户无需出门即可办理各项业务。通 19 过视频通话、文件传输等功能,数字人可以与客户进行实时 互动,确保服务的连续性和安全性。 (3) 多语言及无障碍服务 在全球化的今天,数字人通过配备多语言处理能力,可 以为不同国家和地区的客户提供消除语言障碍的定制化服 互能力、安全能力及应用实现几大部分(见图 3)。 在基础能力方面,通过 3D 建模生成数字分身,数字分 身可基于人体扫描或手工建模的方式获取数字人所需的人 体形状和外观信息,设定文本驱动、视频驱动、语音驱动等 多种驱动方式,结合音视频通讯技术,通过渲染引擎合成显 示数字人。 在交互能力方面,通过语音识别技术,结合大语言模型, 进行语音合成、多轮对话等生成,同时,支持文本、语音、 图像等多模态信息人机交互方式。10 积分 | 53 页 | 2.07 MB | 5 月前3
共 29 条
- 1
- 2
- 3
