视频 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2024年中国人工智能产业研究报告

制”的模式。新兴商业模式为按应用效果或功能点收费，创新的模式可在降低客户采购决策成本的同时，倒逼供应商持续优化产品技术与服务。 5）全球化战略：面对国内激烈竞争，众多企业积极出海，布局海外市场，在图像、视频和社交等领域有较多突破。 6）DeepSeek掀起开源开放与应用落地的热潮：DeepSeek刷新了市场对大模型现阶段性能的认知，其开源策略结合高效、低成本的架构显著加速了中国AI产业向更加高效、开放和自主的其他事件，如AI换脸的诈骗事件自己亲手用上了AI，… 妙鸭相机发布 GPT-4发布 Stable Diffusion、Midjourney… 文生视频Sora出现 AlphaGo击败围棋… ChatGPT发布 ChatGPT发布 AlphaGo击败围棋世界冠军李世石文生视频Sora出现 Stable Diffusion、Midjourney 等文生图产品发布 GPT-4发布妙鸭相机发布自己亲手用上了AI，中国民众认为“AI到来的标志事件” 2.1% 5.2% 6.3% 9.6% 15.0% 27.7% 32.5% 48.8% 52.1% 代码编写类汽车驾驶类视频生成类个人助理类 PPT制作类信息检索类视频处理类图片生成类文本写作类 2016年3月 2022年11月 2024年2月 2022年上半年 2023年4月 2023年7月过去一年大家主要尝试过的AI功能

10 积分 | 51 页 | 3.35 MB | 1 年前
3
2024年中国人工智能产业研究报告

制”的模式。新兴商业模式为按应用效果或功能点收费，创新的模式可在降低客户采购决策成本的同时，倒逼供应商持续优化产品技术与服务。 5）全球化战略：面对国内激烈竞争，众多企业积极出海，布局海外市场，在图像、视频和社交等领域有较多突破。 6）DeepSeek掀起开源开放与应用落地的热潮：DeepSeek刷新了市场对大模型现阶段性能的认知，其开源策略结合高效、低成本的架构显著加速了中国AI产业向更加高效、开放和自主的其他事件，如AI换脸的诈骗事件自己亲手用上了AI，… 妙鸭相机发布 GPT-4发布 Stable Diffusion、Midjourney… 文生视频Sora出现 AlphaGo击败围棋… ChatGPT发布 ChatGPT发布 AlphaGo击败围棋世界冠军李世石文生视频Sora出现 Stable Diffusion、Midjourney 等文生图产品发布 GPT-4发布妙鸭相机发布自己亲手用上了AI，中国民众认为“AI到来的标志事件” 2.1% 5.2% 6.3% 9.6% 15.0% 27.7% 32.5% 48.8% 52.1% 代码编写类汽车驾驶类视频生成类个人助理类 PPT制作类信息检索类视频处理类图片生成类文本写作类 2016年3月 2022年11月 2024年2月 2022年上半年 2023年4月 2023年7月过去一年大家主要尝试过的AI功能

0 积分 | 51 页 | 3.35 MB | 1 年前
3
2025具身机器人行业未来展望报告

优势：数据可大规模获取，成本低 • 劣势：对仿真器要求高，仿真环境与真实世界存在差异；迁移过程中存在性能下降基于真实世界数据采集——直接从现实世界数据中学习，包括本体采集、遥操作、动态捕捉、视频学习等方式。 • 优势：数据更真实可靠 • 劣势：数据少、泛化性差；通过机器本体和人采集，成本高、难度大、效率低国内外厂商大模型进展 04 Partone 16 银河通用抓取基础大模型 MoE组成，其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，MoE中的Latent Planner(隐式规划器)借助大量跨本体和人类操作视频数据获得通用的动作理解能力，MoE中的Action Expert(动作专家)借助百万真机数据获得精细的动作执行能力，三者环环相扣，实现了可以利用人类视频学习，完成小样本快速泛化，降低了具身智能门槛，持续进化，将具身智能推上了一个新台阶。 ViLLA通过预测Latent （VLA）模型。视觉-语言模块（系统 2）通过视觉和语言指令来理解环境。随后的扩散转换器模块（系统 1）实时生成流畅的运动动作。这两个模块紧密耦合，并进行端到端联合训练。英伟达使用真实机器人轨迹、人类视频和合成生成的数据集的异构混合物来训练 GR00T N1，解决了具身智能所面临的数据稀缺和多样性不足的问题，从而提升机器人在复杂环境中的操作能力。英伟达表示，GR00T N1 在多个机器人实施

0 积分 | 31 页 | 3.33 MB | 11 月前
3
中国算力中心行业白皮书

• 从算力中心的定制批发业务发展现状来看，需求端和供给端均展现出积极的发展态势。 ➢ 需求端，随着 AI 大模型的迅猛发展，市场对算力资源的需求呈现出快速增长。这一增长主要源于互联网大厂、云厂商、短视频厂商等行业头部企业对高性能、大规模算力资源的投入持续增长，这一趋势推动了算力中心定制批发业务的高速发展。 ➢ 供给端，受益于新一轮技术升级，算力中心市场迎来更多整合契机。头部企业凭借在技术、资水冷机组精密空调冷却塔算力中心的主要设备算力中心的内部结构算力中心的定义与作用资料来源：灼识咨询数据中心自互联网时代诞生以来，伴随科技的发展进步，在移动互联网、云计算、电商及短视频等行业的推动下快速发展，而生成式AI的兴起正驱动其向重视计算效能与硬件配置的算力中心转型，为行业发展增添新动能。 9 数据中心发展历程时代背景 • 互联网初步兴起，中国进入门户时代下的核心驱动力 • 移动互联网高速发展，微信、微博、移动支付等应用贡献海量数据 • 云计算服务于09年起步 • 云计算技术成熟并普及， 15-21年间，云服务行业迎来高速发展期 • 18年开始，短视频与直播电商行业迅速崛起 • ChatGPT于22年12月推出，AI对算力中心产业形成初步影响 • AI技术取得突破性进展，大模型与AIGC展现出巨大的潜力和价值代表性需求方关键

10 积分 | 54 页 | 6.96 MB | 1 年前
3
2025腾讯云城市峰会·上海站——从智能营销到智能制造

大模型引擎结合物联网和人工智能打造的勘探/安装/巡检一体化平台，节约人力成本，降低安全风险，提高工作效率当前拍摄未来拍摄屋顶四周对角各处细节+视频屋顶照片20多张视频1段 VS 屋顶照片5-10张视频1段屋顶拍摄耗时 15-20分钟 2-5分钟拍摄质量容易造假无死角，难造假场景、节点当前方案未来改善施工警示牌、安全防护，组件铭牌、逆变器、并网箱、线缆组织协同平台 5 6 区块链平台设备运维(机） 5 组织人才(人） 1 0 先进制造智能制造(产）供应链追溯(供) 数字营销(销）智慧服务(服） 7 创新科技音视频平台云原生体系 + + 敏捷弹性数据智能端到端价值链客户需求竞争环境产业政策颠覆技术智能化自动化精益化数字化战略组织技术业务行业联合解决方案 400+ 生成式AI产品生态合作伙伴 1500+ 腾讯云计算腾讯云存储腾讯云网络腾讯云分布式云 ⋯⋯ ⋯⋯ 腾讯云原生 CDN与边缘腾讯云大数据腾讯云数据库腾讯云音视频腾讯云智能腾讯数字孪生腾讯乐享腾讯微卡腾讯电子签 TAPD敏捷项目管理腾讯会议腾讯企点 ⋯⋯ 腾讯安全数据管理与分析精准营销与⽤户增⻓在线协作与培训客户服务管理⻛险管理

10 积分 | 16 页 | 16.40 MB | 1 年前
3
2025年DeepSeek手册：DeepSeek给我们带来的创业机会

从早期基于规则的专家系统，走向基于学习训练的感知型AI  从基于小参数模型的感知型AI，走向基于大参数模型的认知型AI  从擅长理解的认知型AI，发展到擅长文字生成的生成式AI  从语言生成式AI，发展到可理解和生成声音、图片、视频的多模态AI  从生成式AI，发展到推理型AI 专家系统感知AI 认知AI 生成式AI 多模态AI 推理式AI 9 政企、创业者必读人工智能发展历程（二）  从单纯对话的大模型国外：GPT-4等效智能在过去18个月内价格下降240倍  国内：大模型「亏本」卖，可以「白嫖」大模型API能力 19 政企、创业者必读 DeepSeek出现之前的十大预判之七多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时，规模正在变小 20 政企、创业者必读 21 DeepSeek出现之前的十大预判之八智能体推动大模型快速落地  能够调用各种工具，具有行动能力未来产业创意能力赋能企业数转智改数学计算语义理解逻辑推理语言翻译文本创作自动驾驶具身智能 1 2 4 5 知识问答代码编程文本生成多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究脑机接口基础科学能源自由宇宙探索生命科学科学能力 6 AI Fo r Science 知识管理（内部知识管理、外部情报分析、

10 积分 | 76 页 | 5.02 MB | 1 年前
3
北京大学-DeepSeek原理和落地应用2025

人工智能概念辨析 PART 01 大模型相关术语 l 多模态 Ø 文本、图片、音频、视频 l AI工具（国内） Ø DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索... l 通用模型 Ø 大语言模型（LLM，Large Language Model） Ø 视觉模型（图片、视频） Ø 音频模型 Ø 多模态模型 Ø …… l 行业模型（垂直模型、垂类模型）话、内容生成、翻译以及图文、音频、视频等信息处理、生成、对话等。侧重于复杂推理与逻辑能力，擅长数学、编程和自然语言推理任务，适合高难度问题求解和专业领域应用。一般是在生成模型的基础上通过RL方法强化CoT能力而来推理能力在日常语言任务中表现均衡，但在复杂逻辑推理（如数学题求解）上准确率较低。在复杂推理任务表现卓越，尤其擅长数学、代码推理任务。多模态支持支持文本、图像、音频乃至视频输入，可处理多种模

10 积分 | 57 页 | 9.65 MB | 1 年前
3
5G +AI投资策略研究报告

博世安防系统德国综合 20.9 20 7% 5 5 安迅士瑞典综合 9.7 8 17% 6 6 菲利尔美国视频监控 7.8 8 1% 7 9 安朗杰美国门控 5.1 5 13% 8 8 韩华泰科韩国视频监控 4.9 5 -9% 9 11 天地伟业中国视频监控 4.5 3 32% 10 12 AVIGILON 加拿大综合 4.1 4 17% 2010~2017年国内安防市场规模快速增长写入2018年中央一号文，目标是2020年实现公共安全视频监控的“全域覆盖、全网共享、全时可用、全程可控” ，2020年会进入集中验收期，考虑到半年以上的项目建设周期，相关项目订单有望提前到19年，驱动安防to G端需求高增长。雪亮工程项目目标具体要求全域覆盖重点公共区域视频监控覆盖率达到100%，新建、改建高清摄像机比例达到100%；重点行业、领域的重要部位视频监控覆盖率达到 100%，逐步增加高清摄像机的新建、改建数量全网共享重点公共区域视频监控联网率达到100%；重点行业、领域涉及公共区域的视频图像资源联网率达到100% 全时可用重点公共区域安装的视频监控摄像机完好率达到98%，重点行业、领域安装的涉及公共区域的视频监控摄像机完好率达到95%，实现视频图像信息的全天候应用全程可控公共安全视频监控系统联网应用的分层安全体系基本建成，实现重要视频图像信息不失控，敏感视频图像信息不泄露 2.1

10 积分 | 206 页 | 10.47 MB | 1 年前
3
火山引擎&IDC：2024年中国企业多云战略白皮书

高，但集团处于统筹管理的需要，会考虑构建多云统一管理的平台，并对数据进行一体化管理。场景六：满足其他特殊要求。一些企业出于行业特殊性或技术发展要求，会对特殊软件、硬件存在需求，例如对高性能计算服务、视频编解码等，因此会选择多家云服务商，以满足业务发展、技术提升或合规要求。此外，一些企业在面对临时性的突发业务需求时，也会考虑单独采购新的云服务。 �.� 多云战略为企业带来显著实践价值使用效率，从而在运营优化的过程中不断获得新的增量收益。例如某流媒体服务企业，接入多家云服务商的服务后，可根据价格、质量的变化情况，做实时的动态调整。这些云服务商之间的数据目前尚无法交互，但其所承载的同一类视频服务规模会由企业自研的多云管理平台进行动态管理。多云环境加速云原生与AI等能力构建，助力企业构建跨平台灵活应用与智能化升级：多云环境鼓励企业采用云原生技术和标准（如容器、Kubernetes、未来的AI应用将普遍呈现多模态特征，即在推动业务智能化的过程中，大模型需要全面支持对文本、图像、视频等多种数据类型的处理，实现数据的理解、思考和转换。对于单模态而言，通常自然语言生成类模型的训练一般需要GB到TB级别的数据，图像生成类模型的训练需要TB到PB级别的数据，而音视频生成类模型则进一步将数据需求量提升至PB乃至EB级别。多模态模型往往比单模态模型拥有更大的容量，以

0 积分 | 56 页 | 1.97 MB | 1 年前
3
北京金融科技产业联盟：2025年数字孪生技术金融应用研究报告

员、操作四类实体的数字模型，对真实网点进行仿真孪生。基于数字网点，开通客户线上通道，客户即可进入虚拟网点，虚拟网点通过语音识别、自然语言处理、视频图像分析等技术，融合业务建模、深度学习、大数据分析等手段，对业务办理、客户服务过程中产生的图片、语音、视频等非结构化数据进行深度信息挖掘与分析，构建可以与客户完美互动的虚拟网点环境（见图2）。 18 图 2 基于数字孪生技术的虚拟网点逻辑架构过创新的服务方式，吸引年轻客户，增强品牌竞争力。（2）支持远程服务金融机构通过数字孪生技术创建的数字人，可以为客户提供优质的远程服务，客户无需出门即可办理各项业务。通 19 过视频通话、文件传输等功能，数字人可以与客户进行实时互动，确保服务的连续性和安全性。（3）多语言及无障碍服务在全球化的今天，数字人通过配备多语言处理能力，可以为不同国家和地区的客户提供消除语言障碍的定制化服互能力、安全能力及应用实现几大部分（见图 3）。在基础能力方面，通过 3D 建模生成数字分身，数字分身可基于人体扫描或手工建模的方式获取数字人所需的人体形状和外观信息，设定文本驱动、视频驱动、语音驱动等多种驱动方式，结合音视频通讯技术，通过渲染引擎合成显示数字人。在交互能力方面，通过语音识别技术，结合大语言模型，进行语音合成、多轮对话等生成，同时，支持文本、语音、图像等多模态信息人机交互方式。

10 积分 | 53 页 | 2.07 MB | 1 年前
3

共 30 条前往

页

分类

语言

格式

2024年中国人工智能产业研究报告

2024年中国人工智能产业研究报告

2025具身机器人行业未来展望报告

中国算力中心行业白皮书

2025腾讯云城市峰会·上海站——从智能营销到智能制造

2025年DeepSeek手册：DeepSeek给我们带来的创业机会

北京大学-DeepSeek原理和落地应用2025

5G +AI投资策略研究报告

火山引擎&IDC：2024年中国企业多云战略白皮书

北京金融科技产业联盟：2025年数字孪生技术金融应用研究报告