智慧城市中台解决方案(184页-WORD)从而帮助推测出它在此过程中被赋予的含义,以及会受到的潜在影响。当某数据 出现错误或者异常时,我们可通过血缘关系图向上分析锁定问题产生的源头;当 对某些数据进行修改时,可通过影响关系图向下分析,得到哪些数据实体中的数 据会受到影响。还通过提供列级的访问,将追踪的粒度精确到字段。充分理解并 运用这两种图表,将帮助用户在对海量数据进行分析时,降低排查错误的难度, 预测并控制即将造成的影响,最终达到提升数据质量的效果。 智 慧 城 市 系 列 - 公 共 服 务 中 台 数据处理:指组织机构在内部针对动态数据进行的一系列活动的组合。 数据传输:指数据在组织机构内部从一个实体金国网络流动到另一个实体的 过程。 数据交换:指数据经由组织机构内部与外部组织机构及个人交互过程中提供 数据的阶段。 数据销毁:指通过对数据及数据的存储介质通过相应的操作手段,使数据彻 底丢失且无法通过任何手段恢复的过程。 acha wrcha archa 质量模型 实体表 and 质检方案一 …… 质检方案 质量模型 智 慧 城 市 系 列 - 公 共 服 务 中 台 2.3.3.1.3. 质量模型配置 数据质量分析的基本单元, 一个质量模型由可以由一套实体表、 一套规则以 及多套质检方案组成,用户在定义质检方案时,可以根据业务需要选择实体表和 规则,方案与方案之间相互独20 积分 | 254 页 | 2.19 MB | 1 天前3
企业智慧CRM平台重构设计与建设项目实施技术方案(421页 WORD)目录节点信息 主数据管理 主数据自动接收和更新 主数据校验 主数据版本管理 主数据能力开放 27 / 661 主数据归属主题域管理 主数据归属实体管理 主数据归属实体属性管理 主数据编码管理 销售品标签管理 属性规格管理 流量识别管理 流量识别 流量识别规则 营销资源规格管理 营销资源类别管理 营销资源型号管理 承诺消费范围:符合条件的指定商品 3.2.1.3 规则管理 这里所说的规则即指业务规则,指在一定的业务场景中(例如新建客户、 订单入录、产品管理等)被触发,并通过管理和控制业务场景涉及的业务实体 (例如客户、订单、产品等)的属性状态和关系等来实现相应的业务逻辑。 业务规则有以下特征: 1、有正式的业务描述; 2、在某些层面上来对业务进行定义或约束。 规则的实现按照统一配置、统一视图,分布式执行的思路来实现。 题域信息 能够支持对主题域、业务大类等数据实体的信息同步维护更新 主数据归属实体管理 主数据归属实体管理是对主数据归属实体信息进行管理。 能够支持新增主数据归属实体信息,能够建立实体的上下级关系 省 CPC 配置能力中心能够支持修改省管控的主数据归属实体信息 省 CPC 配置能力中心能够支持作废省管控的主数据归属实体信息 省 CPC 配置能力中心能够支持不能作废含有状态为在用的、集团管控20 积分 | 661 页 | 6.42 MB | 13 天前3
智慧矿山(煤矿)项目建设整体解决方案提交。在数据元提取过程中,采 用面向对象的思路,使用业务建模方法,包括业务功能建模、业务流程建模、 信息建模、数据元提取和提交、属性提取等步骤。对于已建应用系统,也可以 根据其自身数据库系统的实体关系图进行数据元的提取,然后直接进行属性提 取。 2.3 设备层标准规范 通过规范物体自描述、物体标识解析和寻址、参数自动感知等核心关键问 39 层次 结构(见图 3-4 所示)。 数据层以地理实体为最小单位设计地图数据的空间存储模型,统一对煤矿 企业的所有图件进行管理。各个业务部门依据该空间存储模型保存与之相关的 数据,从而确保数据的完整性、一致性、共享性以及现势性。将煤矿数据按三 种方式进行存储:空间数据库、瓦片地图文件库、空间数据索引库。空间数据 库存储各业务部门的实体数据;瓦片地图库将一些对空间数据实时要求不高或 58 有限公司 者是空间数据变化周期较长网络地图服务预先绘制好的地图切片存储起来,从 而提高地图服务响应速度;针对煤矿数据类型多样、数据量大的特点,建立和 空间数据库同步的索引库,为各专业应用提供空间实体的搜索奠定基础。数据 管理层是以空间数据库为中心,索引库、瓦片库与空间数据库保持同步。 图 3-4 煤矿协同制图体系结构 服务协同层提供协同系统数据读、写操作的问题,包括地图服务、协同服 务30 积分 | 1295 页 | 44.77 MB | 3 月前3
煤矿数字化矿山技术解决方案(2)实现各自动化系统的数据融合。 (3)具备一定的数据挖掘能力。 (4)具备可建模的联动控制策略。 3. 数字化矿山阶段关键特征 (1)综合自动化、管理信息化、空间数字化三化数据融合; (2)在多维空间矿山实体的基础上动态嵌入与矿山安全、生产、 经营相关的所有信息如环境参数、机电设备运行状态、人员、产量、 业务管理信息等,并找出这些信息内在的联系,赋予数字化矿山更 丰富的含义。 (3)具备基于 GIS 数据处理的前提是在某一认知状态下控制部分空间对象的 数据的精确度存在问题,它的最大特点就是数据处理过程具有“去伪 存真”的功能,不仅点、线、面、体之间在不同认知状态具有内在的 联系,而且随着数据的增加或认知状态的变化,相关空间实体对象 的表现形式,如图形将更加精确,它们与真实地质数据和其它特征 数据之间具有自适应的特征。所以,灰色地理信息系统带有一般控 制系统自适应和动态修正的特征(见图 3-4),这也是灰色地理信息 灰色地理信息系统具有如下特点: 58 数字化矿山(自动化监控、三维综合管理平台)方案 (1)控制空间实体的数据是不完全的,它们只是控制空间实体 所有数据的一部分,无法精确描述空间实体的真实状态。 (2)在获取空间实体数据的任一时刻,真实的空间数据及其属 性为新老原始数据的并集。 (3)在任一时刻,部分图形实体(点、线、面、体)的数据是推 断的,并非实际控制数据,故这些数据完全可能是错误的。 (410 积分 | 798 页 | 40.68 MB | 6 月前3
DeepSeek模型电子政务知识库建设方案-2025数据收集完成后,需要进行初步的数据清洗,去除重复、无效 或噪声数据,确保数据的质量。清洗过程包括但不限于去除 HTML 标签、特殊符号、空值处理以及格式统一化。清洗后的数据需要进 行标注,标注的内容可以包括实体识别、关键词提取、分类标签等, 以便模型能够更好地理解数据内容。 为了提高模型的训练效果,数据需要进行分层抽样,确保不同 类别和主题的数据在训练集中有合理的分布。例如,政策法规、公 共服务、 数据倾斜导致的模型偏差。 数据收集:从政府官方网站、权威数据库、学术期刊及行业报 告中收集数据。 数据清洗:去除 HTML 标签、特殊符号、空值处理及格式统 一化。 数据标注:进行实体识别、关键词提取、分类标签等标注工作。 数据分层:按照不同类别和主题进行分层抽样,确保数据分布 的合理性。 为了进一步提高数据的可用性,可以通过数据增强技术生成更 多的训练样本。数据增强技术包括但不限于同义词替换、句子重组、 在模型训练流程中,我们首先需要明确训练数据的来源和预处 理步骤。电子政务领域的训练数据主要来源于政府公开文件、政策 法规、公共服务问答记录等。数据预处理包括文本清洗、分词、去 除停用词、以及标注关键实体和关系。为了确保数据的多样性和覆 盖面,我们采用多源数据融合策略,结合结构化数据(如数据库记 录)和非结构化数据(如公文文本)。 数据预处理完成后,我们将其划分为训练集、验证集和测试集。 训0 积分 | 178 页 | 456.02 KB | 5 月前3
数字化医疗系统接入DeepSeek构建Agent智能体提效方案(220页 WORD)27%,严重影响就医体验。 当前医疗系统存在三个维度的能力缺口:在数据处理层面,传 统规则引擎无法有效解析 CT 影像标注、病理描述等复杂语义信 息,某省级医院测试显示现有 NLP 工具对放射科报告的实体识别 准确率仅为 68.4%。在流程协同方面,电子病历系统与药房管理系 统的数据对接需要人工转换 17 个关键字段,导致处方审核平均延 迟达 4.7 小时。在智能服务维度,现有 chatbots 检查预约平均等待 3.2 天 ≤1.5 天 动态优先级算法+资源预测 模型 患者服务响应 在线咨询满意度 82% ≥95% 意图理解引擎+知识图谱构 建 该方案需重点突破三个技术瓶颈:第一,医疗实体关系的动态 建模,要求构建覆盖 500+疾病种类的本体库,支持 ICD-10 与 SNOMED CT 的双向映射;第二,多源异构数据的实时处理能力, 需在 200ms 内完成包含 DICOM 影像、LIS 11 秒 85% 跨系统操作步骤 7 次 1 次 86% 医嘱开具错误率 2.3% 0.7% 70% 该方案通过 DeepSeek 智能体的自然语言处理与知识图谱技 术,可自动识别并关联分散数据实体,实现三大核心场景的突破: 门诊病历自动生成完整度达 98%、危急值跨系统预警响应时间缩短 至 30 秒、DRG 分组准确率提升至 93%。这些改进直接推动临床路 径优化和医疗质量指标改善,为后续智能化应用奠定数据基础。40 积分 | 213 页 | 1.48 MB | 4 月前3
政务系统接入DeepSeek构建智能体提效方案分条件流程引导(根据用户户籍、企业类型等属性动态调整材料 清单) 测试数据显示,相较规则引擎方案,对话完成率从 62%提升至 89%,平均对话轮次减少 3.8 轮。 文本结构化处理 通过联合实体识别(NER)和关系抽取技术,可自动从非结构化文 档(如政策文件、办事指南)中提取关键信息,生成机器可处理的 标准化数据。以行政许可事项为例: 该技术使某市住建局审批事项的材料审核时间从平均 45 的多模态理解与生成能力,实现从原始数据到 决策支持的端到端自动化处理。该模块首先对接政务数据库、物联 网设备、社会化媒体等多源异构数据,利用 NLP 技术对非结构化 文本(如群众留言、政策文件)进行实体识别、情感分析和主题聚 类,同时通过计算机视觉技术解析表格、图表等图像数据。关键数 据经过 ETL 流程清洗后,存入分布式数据仓库,形成可追溯的数据 资产。 数据类型 处理技术 输出成果示例 DeepSeek 核心模型,针对政务场景进行垂直 优化: - 模型微调:基于政务语料(政策文件、办事指南等)进行领域适 配训练,提升专业术语理解能力 - 多任务处理:同步集成意图识别(准确率≥92%)、实体抽取 (F1 值≥0.89)和语义匹配模块 - 知识增强:绑定政务知识图谱(平均节点规模 50 万+),实现法 规条款精准关联 服务封装层通过 RESTful API 暴露能力,关键性能指标如下:10 积分 | 273 页 | 1.96 MB | 5 月前3
智能客服知识运营白皮书【公开】 (2)围绕保险中的实体和属性构建的知识图谱,除了有结构之外,实体和属性、属性 和 属性之间也有对应的关系: 1.2.3 程序性知识 程序性知识(procedural knowledge)是“如何做事的知识 ” ,通常有— 组有序的步骤 办理公积金的流程、买手机套餐 的流程 任务问答引擎 以完成某个任务为目 的的流程编排能力 概念性知识 知识图 谱三元 组 用于表示实体与 对应属性的结构 化关系 e.g. 实体:XX 福寿重疾险;属性: 保险责任、理赔条件 … 图谱问答引擎 实体属性的问答能力 版本:1.010 积分 | 27 页 | 605.73 KB | 1 天前3
AI知识库数据处理及AI大模型训练设计方案(204页 WORD)续的模型训练提供高质量的数据基础。数据清洗的关键指标包括: - 数据准确率提升至 99% 以上 - 缺失值处理率达到 98% - 重复数据 删除率不低于 95%。 其次,构建知识图谱与实体关系网络。通过自动化工具和人工 校验相结合的方式,从清洗后的数据中提取实体及其关系,形成结 构化的知识图谱。知识图谱的构建将支持多维度查询和推理,为 AI 模型提供丰富的上下文信息。知识图谱的关键性能指标包括: - 实 体识别准确率达到 特殊符号等)需通过正则表达式或其他工具进行清理。 在文本数据处理中,分词、词性标注以及去除停用词是常见步 骤。对于多语言知识库,需考虑语言的分词特性,采用合适的工具 (如 jieba、NLTK 等)进行处理。此外,命名实体识别(NER)和 术语规范化也有助于提高数据的可解释性和模型训练效果。 对于结构化数据,可能需要进行特征工程。例如,将类别型特 征进行独热编码(One-Hot Encoding),将数值型特征进行标准 去重:确保数据唯一性 4. 异 常值检测与修正 5. 数据格式统一化(时间、文本、单位等) 6. 文 本数据噪声清理 7. 文本分词、词性标注与停用词去除 8. 命名实体 识别与术语规范化 9. 特征工程:编码、标准化、特征选择 10. 数 据分割:训练集、验证集、测试集 11. 数据增强(可选) 通过以上步骤,能够显著提升知识库数据的质量,为后续60 积分 | 220 页 | 760.93 KB | 4 月前3
审计领域接入DeepSeek AI大模型构建Agent智能体提效设计方案(204页 WORD)预打标(如大额交易标记、关联方交易预警) - 时序特征提取:生 成周期性波动分析所需的移动平均序列 归集阶段输出符合审计分析要求的数据立方(Data Cube), 其维度设计如下: 维度类别 要素示例 处理要求 实体维度 客户/供应商/项目编码 主数据一致性校验 时间维度 会计期间/凭证日期 按审计期间自动切片 指标维度 金额/数量/汇率 单位统一与精度控制 审计属性维度 修改痕迹/审批流程状态 元数据完整性验证 机器学习模 型 XGBoost 异常检测模型(F1-score 0.92)+Transformer 合同分析模型(准确率 89%) 推理延迟 <200ms/万条数据 知识图谱 包含 50 万+实体关系的审计知识网络,支持 SPARQL 查询 关联分析响应时间 <300ms 决策层通过动态权重分配算法实现风险量化,具体流程为: 1. 对规则引擎输出的违规事件进行严重度分级 (Critical/Major/Minor) 字段映射(科目代码→标准科 目体系) 关系型数据库 表 半结构化数 据 电子发票、银行对账 单 JSON/XPath 解析 文档数据库存 储 非结构化数 据 采购合同、审批邮件 OCR 识别+NLP 实体抽取(金 额、签约方) 知识图谱三元 组 数据清洗阶段需部署规则引擎与机器学习双校验机制: 1. 规 则校验层:实施强制约束(如借贷平衡校验、凭证号连续性检测) 和软性规则(如异常交易金额阈值告警)10 积分 | 212 页 | 1.52 MB | 1 天前3
共 130 条
- 1
- 2
- 3
- 4
- 5
- 6
- 13
