工业大模型应用报告亿大幅拉升到 1750 亿,GPT-4 非官方估计约达 1.8 万亿。 泛化能力强:大模型能够有效处理多种未见过的数据或新任务。基于注意力机制 (Attention),通过在大规模、多样化的无标注数据集上进行预训练,大模型能够学 习掌握丰富的通用知识和方法,从而在广泛的场景和任务中使用,例如文本生成、自 然语言理解、翻译、数学推导、逻辑推理和多轮对话等。大模型不需要、或者仅需少 量特定 理复杂任务的优势,在更广泛的领域展现着巨大潜力,两者将长期共存。 大模型与小模型有望融合推动工业智能化发展。对于小模型而言,利用大模型的 生成能力可以助力小模型的训练。小模型训练需要大量的标注数据,但现实工业生产 过程可能缺少相关场景的数据,大模型凭借强大的生成能力,可以生成丰富多样的数 据、图像等。例如,在质检环节,大模型可以生成各种可能的产品缺陷图片,为小模 型提供丰富的训练样 11 工业大模型应用报告 3. 工业大模型应用的三种构建模式 大模型的构建可以分为两个关键阶段,一个是预训练阶段,一个是微调阶段。预 训练主要基于大量无标注的数据进行训练,微调是指已经预训练好的模型基础上,使 用特定的数据集进行进一步的训练,以使模型适应特定任务或领域。针对工业大模型, 一是可以基于大量工业数据和通用数据打造预训练工业大模型,支持各类应用的开发。0 积分 | 34 页 | 4.98 MB | 5 月前3
2025年工业大模型白皮书模态的特点,包 括 CAX 模型、传感信号、工艺文件、机器指令等特有数据模态,与通用大模型 常用的文本、图像等数据模态有很大区别。工业数据制备涉及到对这些复杂多 样的数据进行收集、整理、清洗、标注等操作,以便为后续的模型训练提供合 适的数据基础。 图 1.4 工业数据类型(三维图纸、时序信号、二维图纸、机器指令等) 1.1.4 工业基座模型训练 工业基座模型训练是工业大模型构建的重要阶段。在这个阶段,利用经过 小样本与冷启动挑战 工业领域存在显著的长尾分布现象: ➢ 故障样本稀缺:正常工况数据占比超过 99.9%,异常样本获取成本高 ➢ 新设备数据积累不足:产线升级导致的数据分布偏移问题 ➢ 标注质量要求高:需领域专家参与标注,人工成本是通用领域的 5-8 倍 ◼ 数据物理约束特性 工业数据受制于物理规律约束: ➢ 守恒定律:能量、质量等物理量的守恒关系 ➢ 因果时序:设备退化过程的不可逆特性 ➢ 检测模型仅需 50 张样本即可达到 90%准确率。 动态校准:在线学习机制使模型每月数据需求降低,以适应产线的快速换 型。 ⚫ 对比差异:工业大模型的数据利用效率提升 5-8 倍,数据标注成本降低 60%, 突破传统模型的数据依赖瓶颈。 1.4.2 模型能力维度对比 ➢ 传统模型: 18 架构局限:多为单任务专用模型(如 SVM 用于故障分类、CNN 用于视觉10 积分 | 142 页 | 10.54 MB | 5 月前3
中国海外园区可再生能源开发技术潜力评估面积 工业/商业园区 农业园区 发电量 种植用地 装机容量 发电量 装机容量 厂房 用地 工商业区域 光伏发电量 工商业区域 光伏发电量 同工 商业 类园 区评 估方 法 地图 标注 屋顶选取 工具 COIPD COIPD 发电量 直接计算法 装机容量 COIPD COIPD 容量 密度 计算法 最大 风机 间距 情景 园区 面积 最小 风机 等级园区的分类方法详见附件2。 ▪ Tier1园区的屋顶面积数据信息通过人工标注卫 星地图的方式进行采集。其中,卫星地图数据 主要来自Google Map,采用Google Earth Engine (GEE)进行标注,具体方法参见附件3。 ▪ Tier2园区和Tier3园区的屋顶数量较多,采用 与Tier1园区相同的人工标注方法会导致巨大 的工作量,比较耗时。因此,我们最终采用了 基于人工智能技术批量提取的公开屋顶数据 置。经过上述过程仍无法明确地理位置的园区,其数据库中 的位置信息一栏标注为“未知”。本数据库中采用估计坐标 的园区共有31个,未知坐标的园区共有4个。 需要指出的是,共有6个海外园区涉及一区多园。其中, 赞比亚-中国经济贸易合作区分设卢萨卡园区和谦比希园 区,信息较为完善,故分别列出,对于其余园区,则选择其中 一个主要园区的地理位置作为该园区的位置信息,标注在 数据库中。 56 | WRI.ORG.CN10 积分 | 68 页 | 11.63 MB | 4 月前3
IDC:2025年石油石化产业新型工业化白皮书间来深化,但其在支持云技术、工业互联网、物联网和大数据等信息和通信技术(ICT)方面的 潜力巨大,将间接而显著地优化炼化生产的效率。 首先,特定领域标注数据的成本较高,而大数据具有低成本无标注的技术特点,预训练大模 型具备较强的学习共性,可将大数据及特定领域标注数据融合起来,实现具备微调能力的小模 型,进而在智能生产所需的精细化机理和调度模型优化中发挥数学推理的关键作用;其次,BERT 等双向模型 可通过指令微调(IFT)使用情感分析、文本分类、摘要等经典NLP任务来微调模型,在多样化的 任务集上向基础模型示范各种书面指令及输出。在销售服务领域使用人类反馈强化学习(RLH- F),使模型基于人类偏好的数据进行标注,实现智能服务大模型的微调及非监督学习,更精准 了解客户需求与偏好,为未来更优质的服务打下深厚的基础。最后,大模型将定性元素纳入风险 模型的特性,推动石油石化风险控制能力突破,结合机器学习算法预测模拟客户交易行为进而规 ��%,帮助大型石化集团提高印 章校验率到��%以上,合同智能比对提高了��%业务自动化处理效率。 提炼和总结的财务审核规则,采用大模型及doc-VQA等技术,多种模态获 取文档特征,并在少量标注或不标注的情况下实现表格类数据的信息结构 化,采用并发处理机制模式能够及时在业务系统响应审核结果,提高费用 报销审核效率,减少人为失误。 自然语言处 理(NLP) 合同管理 解决方案 � 机器学习 费用报销0 积分 | 65 页 | 2.24 MB | 5 月前3
2025年中国制造业数字化转型行业发展研究报告功能组件/套件的 订阅收费 • API、SDK的定制 开发服务收费 • 云资源订阅 树根互联、雪浪云、 昆仑数据、机智云、 研华科技、忽米等 • 数据汇聚:数据采集、接入、集成等 • 数据处理:数据清洗、标注、转换等 • 数据分析:数据预处理、特征工程等 • 数据应用:工业机理模型沉淀、可视化等 华为、阿里、百度、 腾讯、智谱AI等 模型 相关 服务 知识图谱 以通用大模型能力为基础,直接提 供具体的大模型产品及服务,或者 程机械故障预测、组装线优化等各个场景 比亚迪 三一重工 富士康 需 求 侧 几点思考 Q1:工业大模型落地的主要难点有哪些? 数据挑战:1)数据质量和数量不足。工业领 域数据存在噪声大、缺失值多、格式不统一、 标注困难等问题,而高质量的数据是训练有效 智能体的基础。2)大模型需要能够处理流式 数据。 模型挑战:大模型的可解释性需进一步提升。 Q2:如何理解工业智能体? 定义:当使用正确的数据进行AI模型训练后, 模型优化工程师 2.1% 数据工程师 2.5% 算法工程师 65.0% 算法工程师-CV 0.4% 算法工程师-NLP 0.8% 算法工程师-多模态 4.9% 算法工程师-合伙人 0.4% 文本标注 0.8% 模型运营 2.1% 项目相关 (1.6%) 项目交付 0.4% 项目经理 1.2% 其他 (1.2%) 大模型知识库 0.4% 技术负责人 0.8% 大模型人才地域、经验、薪资等分布情况10 积分 | 55 页 | 3.47 MB | 5 月前3
GIS-BIM-FM智慧建筑运维管理平台解决方案确性,推进建筑、空间、设施设备科学化管理。 基础地理信息数据管理:基于地方地理坐标系及高清航拍图、基础地形、地籍房 籍数据、关键基础设施现状等基础信息,通过空间层级结构,定位空间具体地理位置, 在地图中对区域或建筑进行框选标注,并展示其详细信息。 伟景行智慧建筑运维管理平台解决方案 GIS & BIM & FM 提供便捷的查询、统计等操作,实现物业综合服务。 员进行处 理。 巡逻记录可以将签到日志与计划自动比对,在 PC 端形成结果报 表和图形展示。可根据不同条件进行查询和统计分析。 布点/线路规划 通过二维平面地图或仿真三维地图进行巡逻点标注,维护巡逻点 各项信息,通过对各巡逻点连线规划巡逻线路,系统可自动计算巡 逻距离并获取相应巡逻时间。 伟景行智慧建筑运维管理平台解决方案 培训管理、消防设备设施管理四个模块。详细业务功能如下: 10.2.1. 消防设施巡检 消防设施档案化,将每一个消防设施设备写入电子标签,生成 二维码,打印,粘贴、拍照并建档。 在平面图上标注设备位置,通过平面地图可以查看消防设备具体位 置,方便问题排查。 伟景行智慧建筑运维管理平台解决方案 GIS30 积分 | 130 页 | 29.36 MB | 5 月前3
数智园区行业参考指南感知能力与控制能力。随着 AI 技术的发展,AI 系统需要具 备柔性、持续学习和自主学习能力。例如,在机器视觉应用 中,可以先通过少量数据建立基本的识别能力,然后通过人 工干预的模式对相关的数据进行半监督地标注,以及自动 化、持续性地训练,从而不断提升识别的性能与精度。 部署于边缘端的 AI 和深度视觉应用能够支持数智园区部署 轻量级应用,直接在边缘端对数据进行清洗、预处理、聚 合和筛选,降低云或数据中心的数据处理压力,节省网络 (Vision Transformer) 和 SAM (Segment Anything Model) 为代表的视频大模型对 于视频分析软件的实现带来了很多前所未有的进步。由于它 的训练需要更少的标注且能够带来更高的准确率,视频大模 型的使用可以显著降低模型更新和维护的成本。这些优势将 驱动越来越多的客户考虑放弃原有的传统神经网络模型, 从而转向使用更有效的视频大模型来支撑其视频分析的软0 积分 | 42 页 | 1.71 MB | 4 月前3
罗克韦尔自动化《2024年智能制造现状报告》(第九版)选择:计划在未来 12 个月内从四个选项中选择进行投资。基数:1567 1 2 3 4 5 6 7 8 9 10 零信任架构 生成式设计 人工智能/机器学习 工业元宇宙 射频识别/地理位置标注 语音识别/自然语言 处理 (NLP) 技术 数字主线 AI ::智能制造的未来:: 今年, 85% 的企业已经投0 积分 | 37 页 | 5.96 MB | 5 月前3
新质生产力研究报告(2024年)——从数字经济视角解读字化、网络化、智能化 的生产方式,生产过程推动劳动者向更高技能的复合型技术人才转变。 人力资源和社会保障部发布的《中华人民共和国职业分类大典(2022 年版)》新增 158 个新职业,其中首次标注了 97 个数字职业,占职业 总数的 6%。据世界经济论坛预测,未来 5 年全球企业预计创造约 6900 万个新的工作岗位,其中增长最快的工作类型绝大多数由人工智能和 新质生产力研究报告——从数字经济视角解读(20240 积分 | 43 页 | 1.27 MB | 5 月前3
AI大模型智慧工厂MDC项目设计方案它们在特定应用场景中的效果和精度。 2. 数据源管理与处理 在数据采集层面,项目将整合 MES(制造执行系 统)、SCADA(数据采集与监视控制系统)等多种数据源, 确保数据的全面性和一致性。数据将经过清洗、标注和增强, 确保在 AI 大模型训练和推理中的有效性。 3. 端到端模型部署 考虑到智能工厂对实时性的要求,将采用分布式计算和边缘计 算结合的方式进行模型部署。关键数据将在边缘设备上处理, 以降低延迟并提升响应速度。 从而实现对 未来产品质量的预测。例如,支持向量机(SVM)、决策树和随机 森林都是常见的监督学习算法。它们可以利用传感器数据对设备进 行故障预测,进而指导维护决策。 无监督学习算法则是在没有标注数据的情况下,通过寻找数据 中的模式进行分析。聚类算法如 K-means 和层次聚类可用于生产 数据的归类,以识别出设备运行中的异常情况。通过对设备运行状 态进行聚类,管理者可以更清晰地识别出哪些设备处于正常工作状0 积分 | 175 页 | 506.55 KB | 5 月前3
共 11 条
- 1
- 2
