城市安全风险综合监测预警平台:数据融合管理系统(大数据平台)数据实施治理方案(137页 WORD).................................................................................... 98 7.2.2.3. 数据实体对象................................................................................................. 主题,数据主题还可以划分成更多的子主题,最终到达数据实体一级。而数据实体则 22 城市安全风险综合监测预警平台数据融合实施治理方案 是不可划分的最小单位。主题域、主题、实体的关系如下图所示: 2.2.4.1.2. 概念模型设计 概念模型(CDM,Conceptual Data Model)设计过程主要选择合适的业务主题域 分类管理业务模型生成的主题,并在主题域中存放和组织管理、支撑应用的实体化数 据模型。概念模型一般采用 据模型。概念模型一般采用 E-R 图等工具,按主题域分类定义需要追踪和管理的各种 重要数据实体及其属性,以及实体之间的各种关系,进行初步的实体化。 2.2.4.1.3. 逻辑模型设计 逻辑模型(LDM,Logical Data Model)设计过程是对概念模型的更进一步的实体 化,主要任务就是把概念模型设计阶段建⽴的 E-R 图,按选定的数据建模方法(3NF 范式建模、维度建模、宽表建模等),转换成相应的数据结构表或者详细的10 积分 | 138 页 | 1.54 MB | 22 天前3
大数据平台项目实施规范实施方案(117页 WORD )大数据平台项目实施规范 得系统不依赖特定的开发人员,从而提高系统的可扩展性。 7.5. 元数据管理 元数据管理基于 TongMeta 元数据管理工具,功能主要覆盖到各个业务域的数据 库、表、文件等数据资源实体的业务元数据、管理元数据、技术元数据能以及全域的 标准代码集(维度表)以及编码规范(事实表和维度表)的浏览和维护等。并提供提 供可视化的工具,对标准的各类信息进行图表化展示。 如果把数据比作人 元数据标准文档。 4. 数据标准代码集 通过编制全域统一的标准字典表,统一管理数据标准字典代码,并可将数据 库的各个标准字典表导出为数据标准代码集文档。 5. 信息编码规范 制定全域统一的业务实体编码规范,形成信息编码规范文档。 45 大数据平台项目实施规范 8. 分析设计 8.1. 人员分工 8.1.1. 承建方 1) 负责根据建设方用户需求及调研成果、相关数据标准设计数据仓库概念模型、 据集市,后续再抽象总结出公共数据模型,可以采用自下而上的方式。 8.4. 建模概述 8.4.1. 定义 数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间 联系的形式,来表示现实世界中事务的相互关系的一种映射。在这里数据模型表现的 抽象的实体和实体之间的关系,通过对实体和实体之间关系的定义和描述,来表达实 际的业务中具体的业务关系。 数据建模是数据仓库/商业智能系统的核心,是 ETL 系统的目标、数据库的结构、10 积分 | 117 页 | 4.19 MB | 22 天前3
智慧城市中台解决方案(184页-WORD)从而帮助推测出它在此过程中被赋予的含义,以及会受到的潜在影响。当某数据 出现错误或者异常时,我们可通过血缘关系图向上分析锁定问题产生的源头;当 对某些数据进行修改时,可通过影响关系图向下分析,得到哪些数据实体中的数 据会受到影响。还通过提供列级的访问,将追踪的粒度精确到字段。充分理解并 运用这两种图表,将帮助用户在对海量数据进行分析时,降低排查错误的难度, 预测并控制即将造成的影响,最终达到提升数据质量的效果。 智 慧 城 市 系 列 - 公 共 服 务 中 台 数据处理:指组织机构在内部针对动态数据进行的一系列活动的组合。 数据传输:指数据在组织机构内部从一个实体金国网络流动到另一个实体的 过程。 数据交换:指数据经由组织机构内部与外部组织机构及个人交互过程中提供 数据的阶段。 数据销毁:指通过对数据及数据的存储介质通过相应的操作手段,使数据彻 底丢失且无法通过任何手段恢复的过程。 acha wrcha archa 质量模型 实体表 and 质检方案一 …… 质检方案 质量模型 智 慧 城 市 系 列 - 公 共 服 务 中 台 2.3.3.1.3. 质量模型配置 数据质量分析的基本单元, 一个质量模型由可以由一套实体表、 一套规则以 及多套质检方案组成,用户在定义质检方案时,可以根据业务需要选择实体表和 规则,方案与方案之间相互独20 积分 | 254 页 | 2.19 MB | 1 月前3
基于DeepSeek AI大模型辅助病历书写系统设计方案 (226页 WORD)92%以上。处理层包含以下关键功能模块: 语音转文本引擎:采用端到端深度学习模型,针对医疗场景优 化,专业术语识别准确率比通用引擎提升 35% 语义分析模块:基于条件随机场(CRF)的实体识别技术,可 自动提取症状、体征、病史等 18 类临床要素 逻辑校验组件:通过规则引擎检查时间线矛盾、用药冲突等 9 类常见逻辑错误,错误检出率达 87% 应用层提供可视化编辑界面,医生可对 同步延迟控制在 200ms 以内,每日可处理 10 万级病历数据的实时 写入。 核心服务层包含以下微服务模块: 自然语言处理引擎:集成 BERT+BiLSTM 混合模型,支持中文 医疗实体识别(准确率 92.3%)和关系抽取 语音转写服务:基于 Conformer 架构的 ASR 系统,针对医疗 场景优化后的术语识别准确率达 88.7% 知识图谱服务:包含 50 万+节点的医疗知识图谱,支持 种方言的实时转写,转写准确率在安静环境下可达 95%,嘈 杂环境(如急诊室)降至 88%。NLP 管道采用混合模型架构,结 合规则引擎与轻量级 BERT 变体,实现以下处理流程: 1. 实体识别:定位病历中的症状、体征、检查结果等 12 类医疗 实体 2. ” 关系抽取:建立 药物-剂量- ” 频次 等 9 种临床关系对 3. ” ” 时间归一化:将 三天前 等描述转换为标准日期格式 结构化数据生成器将处理结果转换为符合《电子病历基本架构10 积分 | 239 页 | 1.64 MB | 1 月前3
企业智慧CRM平台重构设计与建设项目实施技术方案(421页 WORD)目录节点信息 主数据管理 主数据自动接收和更新 主数据校验 主数据版本管理 主数据能力开放 27 / 661 主数据归属主题域管理 主数据归属实体管理 主数据归属实体属性管理 主数据编码管理 销售品标签管理 属性规格管理 流量识别管理 流量识别 流量识别规则 营销资源规格管理 营销资源类别管理 营销资源型号管理 承诺消费范围:符合条件的指定商品 3.2.1.3 规则管理 这里所说的规则即指业务规则,指在一定的业务场景中(例如新建客户、 订单入录、产品管理等)被触发,并通过管理和控制业务场景涉及的业务实体 (例如客户、订单、产品等)的属性状态和关系等来实现相应的业务逻辑。 业务规则有以下特征: 1、有正式的业务描述; 2、在某些层面上来对业务进行定义或约束。 规则的实现按照统一配置、统一视图,分布式执行的思路来实现。 题域信息 能够支持对主题域、业务大类等数据实体的信息同步维护更新 主数据归属实体管理 主数据归属实体管理是对主数据归属实体信息进行管理。 能够支持新增主数据归属实体信息,能够建立实体的上下级关系 省 CPC 配置能力中心能够支持修改省管控的主数据归属实体信息 省 CPC 配置能力中心能够支持作废省管控的主数据归属实体信息 省 CPC 配置能力中心能够支持不能作废含有状态为在用的、集团管控20 积分 | 661 页 | 6.42 MB | 1 月前3
智慧矿山(煤矿)项目建设整体解决方案提交。在数据元提取过程中,采 用面向对象的思路,使用业务建模方法,包括业务功能建模、业务流程建模、 信息建模、数据元提取和提交、属性提取等步骤。对于已建应用系统,也可以 根据其自身数据库系统的实体关系图进行数据元的提取,然后直接进行属性提 取。 2.3 设备层标准规范 通过规范物体自描述、物体标识解析和寻址、参数自动感知等核心关键问 39 层次 结构(见图 3-4 所示)。 数据层以地理实体为最小单位设计地图数据的空间存储模型,统一对煤矿 企业的所有图件进行管理。各个业务部门依据该空间存储模型保存与之相关的 数据,从而确保数据的完整性、一致性、共享性以及现势性。将煤矿数据按三 种方式进行存储:空间数据库、瓦片地图文件库、空间数据索引库。空间数据 库存储各业务部门的实体数据;瓦片地图库将一些对空间数据实时要求不高或 58 有限公司 者是空间数据变化周期较长网络地图服务预先绘制好的地图切片存储起来,从 而提高地图服务响应速度;针对煤矿数据类型多样、数据量大的特点,建立和 空间数据库同步的索引库,为各专业应用提供空间实体的搜索奠定基础。数据 管理层是以空间数据库为中心,索引库、瓦片库与空间数据库保持同步。 图 3-4 煤矿协同制图体系结构 服务协同层提供协同系统数据读、写操作的问题,包括地图服务、协同服 务30 积分 | 1295 页 | 44.77 MB | 4 月前3
煤矿数字化矿山技术解决方案(2)实现各自动化系统的数据融合。 (3)具备一定的数据挖掘能力。 (4)具备可建模的联动控制策略。 3. 数字化矿山阶段关键特征 (1)综合自动化、管理信息化、空间数字化三化数据融合; (2)在多维空间矿山实体的基础上动态嵌入与矿山安全、生产、 经营相关的所有信息如环境参数、机电设备运行状态、人员、产量、 业务管理信息等,并找出这些信息内在的联系,赋予数字化矿山更 丰富的含义。 (3)具备基于 GIS 数据处理的前提是在某一认知状态下控制部分空间对象的 数据的精确度存在问题,它的最大特点就是数据处理过程具有“去伪 存真”的功能,不仅点、线、面、体之间在不同认知状态具有内在的 联系,而且随着数据的增加或认知状态的变化,相关空间实体对象 的表现形式,如图形将更加精确,它们与真实地质数据和其它特征 数据之间具有自适应的特征。所以,灰色地理信息系统带有一般控 制系统自适应和动态修正的特征(见图 3-4),这也是灰色地理信息 灰色地理信息系统具有如下特点: 58 数字化矿山(自动化监控、三维综合管理平台)方案 (1)控制空间实体的数据是不完全的,它们只是控制空间实体 所有数据的一部分,无法精确描述空间实体的真实状态。 (2)在获取空间实体数据的任一时刻,真实的空间数据及其属 性为新老原始数据的并集。 (3)在任一时刻,部分图形实体(点、线、面、体)的数据是推 断的,并非实际控制数据,故这些数据完全可能是错误的。 (410 积分 | 798 页 | 40.68 MB | 7 月前3
某企业级省大数据平台工程建设方案(636页 WORD)格式,或者创建具有不同别名且与使用者查 看数据方法相一致的视图。 业务层 – “业务层”的构思基础是业务具有标准或规范的方法来描述关键的业 务实体,例如客户和产品。在金融行业,人们经常根据金融工具和很多其它实 体中的发行人来访问信息。数据建模者通常会与业务专家和数据提供者共同定 义一套反应这些业务实体的“逻辑”或“规范”视图。这些视图可被重复利用,并且 应当被多个使用者用于多种业务范围。 格式层 – 物理数据源最 行 映射功能所需的元数据。该层是“原样”层,因此实体名称和属性在该层中不会 改变。 数据源 –数据源是存在于组织内部和外部的物理信息资产。这些资产可能是 数据库以及 SAP、Web 服务、Excel 电子表格等包装应用程序。 3) 数据路由 所谓的数据路由,是因为不管是 API 还是类 SQL 查询请求时,使用方是针 对逻辑的数据实体进行查询,但数据的物理部署可能是复杂的,甚至是分布在 格式,或者创建具有不同别名且与使用者查看数 据方法相一致的视图。 业务层 – “业务层”的构思基础是业务具有标准或规范的方法来描述关键的业务 实体,例如客户和产品。在金融行业,人们经常根据金融工具和很多其它实体 中的发行人来访问信息。数据建模者通常会与业务专家和数据提供者共同定义 一套反应这些业务实体的“逻辑”或“规范”视图。这些视图可被重复利用,并且应 当被多个使用者用于多种业务范围。 格式层 – 物理数据源最30 积分 | 973 页 | 40.66 MB | 22 天前3
DeepSeek模型电子政务知识库建设方案-2025数据收集完成后,需要进行初步的数据清洗,去除重复、无效 或噪声数据,确保数据的质量。清洗过程包括但不限于去除 HTML 标签、特殊符号、空值处理以及格式统一化。清洗后的数据需要进 行标注,标注的内容可以包括实体识别、关键词提取、分类标签等, 以便模型能够更好地理解数据内容。 为了提高模型的训练效果,数据需要进行分层抽样,确保不同 类别和主题的数据在训练集中有合理的分布。例如,政策法规、公 共服务、 数据倾斜导致的模型偏差。 数据收集:从政府官方网站、权威数据库、学术期刊及行业报 告中收集数据。 数据清洗:去除 HTML 标签、特殊符号、空值处理及格式统 一化。 数据标注:进行实体识别、关键词提取、分类标签等标注工作。 数据分层:按照不同类别和主题进行分层抽样,确保数据分布 的合理性。 为了进一步提高数据的可用性,可以通过数据增强技术生成更 多的训练样本。数据增强技术包括但不限于同义词替换、句子重组、 在模型训练流程中,我们首先需要明确训练数据的来源和预处 理步骤。电子政务领域的训练数据主要来源于政府公开文件、政策 法规、公共服务问答记录等。数据预处理包括文本清洗、分词、去 除停用词、以及标注关键实体和关系。为了确保数据的多样性和覆 盖面,我们采用多源数据融合策略,结合结构化数据(如数据库记 录)和非结构化数据(如公文文本)。 数据预处理完成后,我们将其划分为训练集、验证集和测试集。 训0 积分 | 178 页 | 456.02 KB | 6 月前3
数字化医疗系统接入DeepSeek构建Agent智能体提效方案(220页 WORD)27%,严重影响就医体验。 当前医疗系统存在三个维度的能力缺口:在数据处理层面,传 统规则引擎无法有效解析 CT 影像标注、病理描述等复杂语义信 息,某省级医院测试显示现有 NLP 工具对放射科报告的实体识别 准确率仅为 68.4%。在流程协同方面,电子病历系统与药房管理系 统的数据对接需要人工转换 17 个关键字段,导致处方审核平均延 迟达 4.7 小时。在智能服务维度,现有 chatbots 检查预约平均等待 3.2 天 ≤1.5 天 动态优先级算法+资源预测 模型 患者服务响应 在线咨询满意度 82% ≥95% 意图理解引擎+知识图谱构 建 该方案需重点突破三个技术瓶颈:第一,医疗实体关系的动态 建模,要求构建覆盖 500+疾病种类的本体库,支持 ICD-10 与 SNOMED CT 的双向映射;第二,多源异构数据的实时处理能力, 需在 200ms 内完成包含 DICOM 影像、LIS 11 秒 85% 跨系统操作步骤 7 次 1 次 86% 医嘱开具错误率 2.3% 0.7% 70% 该方案通过 DeepSeek 智能体的自然语言处理与知识图谱技 术,可自动识别并关联分散数据实体,实现三大核心场景的突破: 门诊病历自动生成完整度达 98%、危急值跨系统预警响应时间缩短 至 30 秒、DRG 分组准确率提升至 93%。这些改进直接推动临床路 径优化和医疗质量指标改善,为后续智能化应用奠定数据基础。40 积分 | 213 页 | 1.48 MB | 5 月前3
共 159 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16
