2025年构建多技术融合的湖仓一体化平台,打造银行数据智核新引擎报告
言及建设工作。 演进路线(一) 结构化数据 贴源 模型 集市 BI 报表 集市 半/半结构化数据 历史 归档 实时 计算 数据仓库 BI 报表 数据湖 结构化数据 贴源 模型 集市 BI 报表 集市 半/半结构化数据 历史 归档 实时 计算 湖仓分体 数据探索 机器学习 结构化数据 模型 集市 BI 报表 集市 半/半结构化数据 湖仓一体 — — 湖内建仓 数据探索 机器学习 结构化数据 模型 集市 BI 报表 集市 半/半结构化数据 湖仓一体 — 湖仓分体 数据探索 机器学习 实时 计算 流批 一体 贴源 归档 湖仓分体,数据仓库与数据 湖分离搭建,通过数据交换 平台完成数据同步。 特点: (1)双路建设,双路加载, 耦合度低 (2)互不依赖,使用独立, 管理独立 湖内建仓,将数据仓 库与大数据平台的功 数据 集市层 报送 集市 外部/法 人 数据区 历史 数据区 仓模块 实时 数据区 湖模块 报表 集市 财务 集市 客户 集市 绩效 集市 风险 集市 半结构化/非 结构化 数据区 逻辑加工区 ...... 实时 数据区 明细 数据 汇总 数据 指标 数据 缓存层 贴源层 标准层 通用汇总10 积分 | 21 页 | 3.74 MB | 5 月前32025年AI CITY发展研究报告——“人工智能+”时代的智慧城市发展范式创新
数据是信息的载体,是描述客观世界的符号记录,数据的整合汇聚是构建知识与高质量数据集的基础前提。首 先,通过API接口对接、网络爬虫、文件导入、边缘计算等技术采集外部数据资源,包括结构化数据(如关系型数据 库、Excel表格)、半结构化数据(如JSON/XML日志)、非结构化数据(文本、图像、音频等)。同时,依托政府或 企业内部的数据共享平台、数据开放平台等,实现内部数据的集中汇聚。其次,运用ETL工具完成数据清洗转换,通 资源的准确性与一致性,形成可供分析的基础数 据资源。 知识库: 知识是从数据中提炼出的有价值的信息,是对数据的深度理解与抽象概括,知识的形成是数据价值升维的过 程。首先,对基础数据资源进行结构化处理,通过统计分析、文本向量化、图像特征提取等技术构建输入特征空间。 其次,选择监督学习、无监督学习、深度学习算法等适配算法,利用梯度下降等优化方法拟合数据分布,通过交叉验 证和正则化避免过拟合 量产业特质、业务逻辑、价值度量上与人工智能技术的匹配度,实现“双向奔赴”。一是优先聚焦数字化基础雄厚、 工具应用广泛且数据资源丰富的主导产业。如已部署RPA、SQL、BI等应用的业务领域,拥有充足结构化数据集。二 是锚定核心业务。聚焦核心业务流程中的关键流程,选择小切口突破,基于业务特点深挖AI赋能应用潜力。三是推动 大小模型协同。充分释放大模型泛化能力,处理语言理解等擅长任务,同时借助小模型精准攻克特定难题,以大小模20 积分 | 78 页 | 5.45 MB | 4 月前3中兴通讯自智网络白皮书2025
个闭环的、高效的创新生态。 23 中兴通讯高阶自智网络演进方案 数据引擎通过数据采集、数据治理、数据存储、数据处理等功能来支持智能应用。支持多源采集与格式处理,支持多 种数据源和结构化、半结构化、非结构化数据,提供数据转换(格式、编码等)和清洗(去重、处理缺失值等),支持湖 仓一体的数据存储,支持对数据安全与隐私保护,提供数据加密和访问控制,并提供数据接口、数据共享和交互。未来 Gen 要求,大大节省工作量,将交换机故障识别和诊断过程从140分钟以上,降低到20分钟以内。 图10 网络云故障智能处理方案图 29 中兴通讯高阶自智网络实践案例 用户意图输入 通信大模型 AIOps小模型 结构化大模型 (具泛化能力) 训练平台 离线训练 CIIA 运维应用 看网助手 故障助手 值守助手 ... 多智能体 场景 智能体 监控 智能体 故障处理 智能体 KPI分析 智能体 知识问答10 积分 | 41 页 | 7.03 MB | 6 月前3中国建筑业企业数字化研究报告(2024)-北京中建协认证中心
大数据分析技术是指利用先进的数据采集、存储、处理和分析技术,从海 量、多源、异构的数据中提取有价值信息的过程和方法。在建筑业中,大数据 分析主要处理来自设计文档、BIM 模型、施工记录、设备传感器、市场调研等 多种渠道的结构化和非结构化数据。这些数据具有数量庞大(Volume)、类型 多样(Variety)、生成速度快(Velocity)、真实性要求高(Veracity)和价 值密度低(Value)等"5V"特性。 术使机器能够"看懂 "施工现场和建筑构件,实现自动检测和识别。自然语言处理则使 AI 系统能够 理解和生成人类语言,支持智能文档处理和交互式设计辅助。知识图谱通过构 建概念间的关联网络,形成结构化的知识体系,为 AI 系统提供推理和决策的基 础。 在建筑领域,AI 技术的实现依赖于高质量的建筑数据集、适配建筑特性的 算法模型、高性能的计算基础设施以及专业领域知识与 AI 技术的融合应用框架。 针对地基基础施工、基坑开 挖或地下空间利用等进行优化模拟和可行性论证。导则还强调了数据格式的统 中国建筑业企业数字化研究报告 40 一与交付标准的重要性,需要对数据进行结构化的分解,并以通用、开源的数 据格式进行交付,以便后续设计、施工环节可完整调用。 最后,安全与合规性也是数字勘察技术体系的重要方面。对由无人机、激 光雷达、卫星导航等技术获取的海量地形地貌信息,应遵循统一的格式与标准,20 积分 | 115 页 | 10.19 MB | 5 月前3中国移动:云智算技术白皮书(2025)
开发流程智能化、协作效率高效化、应用落地简便化, 助力规模化 AI 应用落地。 2.5.5.1 向量数据库 人工智能所需数据的复杂性和多样性正以前所未有的速度增长,而传统数据 库技术不适用于海量的非结构化数据处理。向量数据库针对非结构化数据的处理 进行优化,尤其擅长高效的相似性搜索,通过将数据转化为高维向量,实现对文 本、图像、音频等复杂数据的高效处理,正在成为 AI 时代不可或缺的关键数据 处理技术。当前中 维的高维数据,与大模型无缝集成,广泛应用于人工智能、机器学习、推荐系统、 图像识别等领域。 面向近期,针对不同类型的向量数据和应用场景,增强对全文检索、多路检 索召回和融合排序等关键技术的支持,获取更全面的非结构化数据信息,提高检 索结果的相关性和准确性。 19 面向中远期,向量数据库进一步与大语言模型(LLM)等人工智能技术深度 融合,更好地支持 RAG(检索增强生成)等应用场景。持续提升自适应能力,能0 积分 | 30 页 | 716.31 KB | 5 月前3《行业瞭望》矿山专刊--新华三
的数据,也包 括一些结构化、半结构化和非结构化数据。实现集团全量数据应汇尽汇,应接尽接的目标。 采:采数据。对分布在集团不同单位、不同系统、不同地域、不同结构、不同方式的数据, 进行分类、分级采集,针对物联网、煤炭生产、供电、供热预警数据通过流式方式实时采集, 采集时间可达到1秒之内。针对人资、综合管控等结构化数据采用T+1离线数据采集模式, 定期采集。针对非结构化数据定时通过文件方式采集。 集。 存:存数据。针对不同采集方式、不同结构的数据,利用Hadoop存储非结构化数据和离线 数据,利用MPP分布式并行数据库存储实时数据、快速查询数据。实现不同场景的数据分类 高效存储,提升海量数据处理和快速查询的效率。 算:算数据。根据业内行标和自身业务实际情况制定主数据、元数据、数据标准等管理办法 和标准管理体系,为数据治理、质量监控提供标准。数据快速响应:构建离线数仓和实时数 仓 Flink 计算 归集库 主题库 专题库 DE大数据平台 HDFS Hbase 生产分析 供热分析 告警分析 产量预测 ……. 融 合 集 成 平 台 流式数据 半/结构化数据 非结构化数据 语音/文件、图片/….. AI 分析 批数据处理 数据运营平台 数据标准 数据治理 数据开发 …… MPP 实时数据分析 历史数据分析 汇 采 存 用 算 160 智慧矿山技术专家10 积分 | 189 页 | 25.75 MB | 6 月前32025年量子计算应用能力指标与测评研究报告-量子信息网络产业联盟-
对接的核心性能指标,尝试从应用需求层面评估量子计算真实能力, 从而能够综合判断量子计算技术成熟度,推动当前 NISQ 实用化。 特别需要说明的是,量子计算目前仅在量子模拟、大数分解、线 性系统求解、非结构化搜索等方面有理论优势,在组合优化、机器学 习方面有潜在优势,但暂时缺乏理论证明。应用评测只是针对给定计 算问题与量子算法,在给定量子计算系统上,与经典计算进行对比, 目标是评估该类问题是否适用量子计算,而不是给出该类问题是否必 的引入带来了极大的模型训练与推理资源开销。 在数据处理方面,通感算智融合的移动网络无论网络内数据还 是网外数据都将爆炸式增长,包括网络状态数据、基站侧数据、用 户侧数据、信令数据、运维数据、专家经验数据等结构化与非结构 化数据。高效的网络运营,离不开高效的大数据处理与支持。网络 大数据处理包括数据清洗与集成、数据降维、数据特征提取、知识 提取等,这些通常基于统计类模型或神经网络类模型来实现。海量0 积分 | 46 页 | 1.93 MB | 5 月前3CIC灼识咨询:2025中国供应链金融科技行业蓝皮书
资产支持票据,是一种债务融资工具,该票据由特定资产所产生的可预测现金流作为还款支持,并约定在一 定期限内还本付息 ABS Asset-backed Securities 资产支持证券,是指以基础资产未来所产生的现金流为偿付支持,通过结构化设计进行信用增级,在此基础上发行资 产支持证券的过程 BaaS Blockchain as a Service 区块链即服务,是指将区块链框架嵌入云计算平台,利用云服务基础设施的部署和管理优势,为开发者提供便捷、高 信用评估结果 灵活贷款审批 智能化 可视化 债权多级 拆分流转 信用 全链条渗透 自动化 依托多维度、多层次 数据,降低供应链金 融风险水平 1 2 3 打通数据信息 风险结构化 供应链金融科技解决方案提高供应链金融运营效率,降低风险水平,让服务渗透全产业中小微企业 供应链金融科技解决方案的价值分析 -供应链金融科技解决方案能提高供应链金融的融资运营效率,降低风险水平,20 积分 | 30 页 | 7.13 MB | 5 月前3趋势纲要 2050 : 技术与创新
讲故事等领域 - 具有挑战性 关于人类优越性的传统假设 创造性任务 • 组织应该评估 Human - AI 是否 系统优于人类或 AI 独立工作。 AI在创意领域展现出巨大的潜力,可通过明确的指导原则和结构化 流程进行战略利用。 • 在创造性任务中的人与人工智能协作可以显示出明显的优势 , 例 如,生成文本、图像或视频。人类提供创新的方向,而AI则通过执 行重复性过程来提升效率。 31% 23% • 公司需要评估其价值链,以识别生成式AI的高度影响机会,可以使用如罗兰贝格AI就绪雷达等工具来与竞争对手的采用情况进 行基准比较 • 进一步地,公司应设定清晰的战略目标,定义生产力基准,并结构化非结构化数据以确保AI的有效性。组织可以 根据需要优化现有AI模型或开发自定义模型 • 公司还可以实施有针对性的AI用例,评估并逐步改进其性能,在整个组织内逐步 推广,同时严格维护数据安全和隐私标准 •0 积分 | 72 页 | 2.97 MB | 5 月前3MoonFox月狐数据:2025年智能PPT行业市场研究报告
目前行业应用普遍具备基础PPT生成能力并快速向高质量AI生产进阶 情景感知交互 能力提升 智能处理 精确度提升 全流程理解 能力提升 21 • OpenAI-o1:具备通用推理能力 • OpenAI-o3:结构化的内部推理 过程解决编程 • Deepseek-R1:提升思维深度与 推理能力,在数学、编码、常识 和写作等多方面测试位列前茅 新机会伴随着大模型技术提升而形成,智能PPT商业模式初显,市场将持续整合20 积分 | 23 页 | 4.73 MB | 4 月前3
共 21 条
- 1
- 2
- 3