智能风控典藏版合集(377页)成就百万数据科学家! 9 模型的开发和构建。企业模型解释在优化模型的期间,是一个优化 模型的一个非常重要的手段。在实际的模型构建的过程中,这种 bad case 分析寻找模型优化方向还是一个比较困难的问题,如果模型可 解释,可以对出错的样本采取针对性的措施对模型进行优化。 我们的模型试运行上线期间。模型的可解释性能够提升模型的可信 度,同时有利于业务的推广。 模型推广期间, 重新训练一个简单的模型,如线性模型,然后利用这种解释性较好的方法 来解释预测样本。 4. 模型解释性方法-shap DataFunTalk 成就百万数据科学家! 13 修改方法中将某一特征与其他所有特征子集进行博弈比较,计算其对于其 他特征子集对预测结果的影响。预测值和各个特征的贡献值之间存在着这 样的映射关系,预测的所有的贡献值求和,代入如上图所示方程式中,得 到对应的一个预测样本。其中红色代表对于预测结果具有最大的优先贡献, 简单展望: 图技术:图这种数据结构的话,它具有比较天然的可解释性的优势, 比如说它有自己的实体,有自己的属性,实体属性之间它有相互的 之间的一个关系。当然这两种技术的话可能是差别比较大,找到这 DataFunTalk 成就百万数据科学家! 20 样一种桥梁,能够让他们两个联合起来,或者说一种方式能够相互 配合起来,也是一个比较困难的事情。 模型蒸馏:模型蒸馏也是被广泛采用模型整理的一个整体思路就是20 积分 | 377 页 | 30.66 MB | 3 月前3
电商网站智能客服应用方案(54页PPT)符串 > c. 两个语句的 n-gram 相似性的特征 > d. 两个语句 Jaccard 相似度 :两个字符串字的交集 / 字的并集 > e.TF-IDF 相似度 :通过计算 TF-IDF 比较相似度 基础特征提取 大数掘挖掘专家 18 > 编辑距离 : 通过 n 次增加、删除、替换一个字符的操作 ,将一段字符串转换为另外一段字符串。 基础特征提取 大数掘挖掘专家 19 > n_garm 将一个词所在的上下文中的词作为输入 ,而那个词本身作为输 出 ,也就是说 ,看到一个上下文 ,希望大概能猜出这个词和它的意思。 通过在一个大的语料库训练 ,得到一个从输入层到隐含层的权重模型。 2-gram 比较常用。 > 其中 , w↓t =(0,…,1,…,0) ,是 one-hot 编码。 词向量 大数掘挖掘专家 26 两种训练模型 : Skip-gram (Continuous Skip-gram Model) > Skip-gram 它的做法是 ,将一个词所在的上下文中的词作为输出 ,而 那个词本身作为输入 ,也就是说 ,给出一个词 ,希望预测可能出现的 上下文的词 , 2-gram 比较常用。 > 其中 , w↓t =(0,…,1,…,0) ,是 one-hot 编码。 词向量 大数掘挖掘专家 27 以 CBOW 演示词向量生成过程 > 输入层 :上下文单词的 one-hot0 积分 | 53 页 | 4.02 MB | 3 月前3
智能制造关键技术(虚拟现实与人工智能技术)虚拟现实是多种技术的综合,包括实时三维计算机图形技术,广角(宽视 野)立体显示技术,对观察者头、眼和手的跟踪技术,以及触觉 / 力觉反馈、 立体声、网络传输、语音输入输出技术等。 ( 1 )实时三维计算机图形 相比较而言,利用计算机模型产生图形图像并不是太难的事情。如果有足够准 确的模型,又有足够的时间,我们就可以生成不同光照条件下各种物体的精确 图像,但是这里的关键是实时。例如在飞行模拟系统中,图像的刷新相当重要, 在用户与计算机的交互中,键盘和鼠标是目前最常用的工具,但对于三维空间 来说,它们都不太适合。在三维空间中因为有六个自由度,我们很难找出比较直观 的办法把鼠标的平面运动映射成三维空间的任意运动。现在,已经有一些设备可以 提供六个自由度,如 3Space 数字化仪和 SpaceBall 空间球等。另外一些性能比较 优异的设备是数据手套和数据衣。 6 ( 3 )声音 人能够很好地判定声20 积分 | 24 页 | 4.03 MB | 7 月前3
DeepSeek冲击下,AI产业对国内电力行业的变与不变........................................................................... 9 图表 10: 各数据中心供配电方案参数比较 .................................................................................................. 0%(相比 UPS 方案高 2.9pct),全链路效 率为 91.1%(相比 UPS 方案高 4.5pct),并且占地面积相较 UPS 减少约 80%。 图表10: 各数据中心供配电方案参数比较 SST 系统 巴拿马电源系统 传统 HVDC 系统 AC UPS 系统 系统效率 98.0% 97.5% 95.1% 95.1% 全链路效率 91.1% 90.6% 期)》,华泰研究 HVDC 保持高装机增速,但 UPS 仍居市场主流。纵向比较,由于 HVDC 行业相关统计较 少,我们通过HVDC新增装机容量和UPS市场规模的CAGR进行比较。2019-2022年HVDC 系统在数据中心年新增装机 CAGR 为 23%,而同期 UPS 行业市场规模 CAGR 为 11%;横 向比较,根据智研咨询数据,2021 年 HVDC 占比约为 12%,UPS 仍以 78%渗透率处于主10 积分 | 25 页 | 2.88 MB | 9 月前3
【智慧交通】城市公共车联网综合服务平台方案(堵塞及交通事故所造成的损失。在未来 20 年里,美国智能交通相关产品及服务市场容量将超 过 4200 亿美元,相关项目将超过 60 万个。 1.2 需求分析 目前国内的交通系统信息化应用还比较落后,智能交通系统在国内基本处于空白阶段,在 地域分布上,国内的各大城市对于智能交通的发展都非常重视。应用先进的物联网技术,可以 实现并对公共交通资源数据的实时获取和高效管理和维护,并自动反馈信号到车载系统等终端 技术系统的构造第一个关键。信息处理包括信号的预 处理、后置处理、特征提取与选择等。识别的主要任务是对经过处理信息进行辨识与分类。它 利用被识别(或诊 断)对象与特征信息间的关联关系模型对输入的特征信息集进行辨识、比较、 分类和判断。因此,传感技术是遵循信息论和系统论的。它包含了众多的高新技术、被 众多的 产业广泛采用。它也是现代科学技术发展的基础条件,应该受到足够地重视。 微型无线传感技术以及以此组件的传感网是物联网感知层的重要技术手段。 100m( 200 m)之 内。无线发射器的发射功率较低,发射功率一般小于 100 mW。自由地连接各种个人便携式电 子设备、计算机外部设备和各种家用电气设备,实现信息共享和多业务的无线传输。 目前比较常见的短距离无线通信技术包括以下几种。 1) Bluetooth(蓝牙)技术 2) WLAN (无线局域网)技术 IEEE 802.11 系列 HiperLAN 系列 3) IrDA20 积分 | 25 页 | 651.04 KB | 7 月前3
中国数智化审计调研报告........................ 10 ( 三 ) 组织已基本具备数智化审计所需数据环境.......................... 12 ( 四 ) 组织在数智化审计时比较重视工具的使用.......................... 13 ( 五 ) 当前数智化审计还没有充分开展........................................ 14 以上受访者对数智化审计所需的胜 任能力,已经有了较为清晰的认识。 ■ 组织已具备基本的数据治理环境。68.06% 的受访者认为其所在组织可以为开展数智 化审计提供有质量的数据支撑。 ■ 数智化审计时比较重视工具的使用。已经开展数智化审计的组织较多使用的辅助工具 分别是数据分析、数据可视化、数据库审计、数据资产管理、AI 数据分析等类型的工具。 ■ 当前数智化审计还没有充分开展起来。只有 24.08% 理和存储数据的 流程和习惯,说明他们已经走在了数字化转型的道路上,并且已经有相对成熟的数字化业务 流程。 图表.7.数据治理环境 13 数智化审计调研报告 ( 四 ) 组织在数智化审计时比较重视工具的使用 数据分析工具、数据可视化工具、数据库审计工具、数据资产管理工具、AI 数据分析是 组织使用较多的审计辅助工具,这反映了组织在数智化审计过程,对业务数据分析和 IT 资 产梳理较为重视。20 积分 | 32 页 | 7.70 MB | 3 月前3
自然资源保护区大数据信息化管理平台建设方案控现场涉 案的人员、物品准确认定,不具备很好的对侦破工作的指导性和法 律质证能力。采用高清摄像机获取高清晰度的监控画面,更能清楚 地呈现监控原貌。高清视频监控图像与标清视频图像清晰度的直观 比较如下图所示: 2)采用网络传输,质量更可靠,施工更方便 79 自然资源保护区大数据信息化管理平台建设方案 本视频监控系统以网络为平台,采用全新的设计理念,以 IP 地 址来识别所有的监控设备,采用统一的 和存储;控制信号通过汇聚交换机传输到前端设备,完成对前端高 88 自然资源保护区大数据信息化管理平台建设方案 清摄像机的控制。 根据两种传输方式的特性,在本案的视频安防监控系统当中, 两种传输方式比较如下: 1) 图像质量 光纤>超五类非屏蔽双绞线; 2) 传输距离: 光纤>超五类非屏蔽双绞线; 3) 无线网桥传输: 根据本次监控系统的整体构架及保护区实地情况,对于不同场 合、不同的传输距离,选择不同的传输方式。 等特点,以保证连续 正常运行。 传统的大屏幕系统一般由编码器、矩阵、大屏控制器构成,组 97 视频综 视频综 前 端 前 端 前 端 自然资源保护区大数据信息化管理平台建设方案 成比较复杂,每个环节都有可能存在不稳定因素,而且环节越多导 致了排查错误约困难,而我司的视频综合平台将编码、矩阵以及大 屏控制器整合在一起,在满足功能需求的基础上操作简便、维护简 单、管理简捷。 320 积分 | 708 页 | 26.18 MB | 8 月前3
网络安全主动防御技术 策略、方法和挑战时 ,广 泛 应 用 于 云 环 境 、区 块 链 、智 能 电 网 等 科 学 、工 业 领 域 . 现有的主动防御相关综述主要介绍了一种技术的策略或 方法,同时也对3种技术进行了一定程度的比较:文献[2]中 提出欺骗防御是移动目标防御的一部分;文献[3]在对欺骗防 御分类时,将移动目标防御当成欺骗防御的一部分;文献[4] 中则提出移动目标防御系统可以看作拟态防御系统的一个特 例,它通过一些拟态变换使系统具有动态性特征 能与资源消耗之间的最优平衡点,在防御性能不降低的情况 下,显著降低了网络资源消耗[63]. 按攻击面转换策略(how)进行分类,可 以 对 移 动 目 标 防 御的不同部署策略进行总结,有助于比较各种策略的优劣,进 行策略之间的相互结合和补充,并确定不同策略适用的部署 场景,进一步提高 MTD 的安全性能. 3 欺骗防御 3.1 欺骗防御概述 3.1.1 欺骗防御的定义 欺骗防御 通过制定的表决策略对n个异构执行体的输出结果进行 表决后输出,随后调用调度器对执行体进行反馈调节.目前, 可用的表决策略算法主要有全体一致表决算法、多数一致表 决算法和多数一致性表决的改进算法. 多数一致表决算法中比较典型的是k/n表决算法.如果 在n 个异构执行体的输出结果中,有至少k 个执行体的输出 结果一致,那么将k 个执行体的输出结果作为 最 终 输 出[89]. 而多数一致性表决的改进算法是在多数一致表决算法的基础10 积分 | 14 页 | 2.83 MB | 3 月前3
英特尔-教育行业AI实战手册2024略,如图 2-1-10 所示, • 当新数据集比较大且和原数据集相似度较低时,可以对整 个网络进行重新训练(图中策略 A); • 当新数据集比较大且和原数据集相似度较高时,可以采用参 数微调模式微调整个网络(图中策略 B); • 当新数据集比较小且和原数据集相似度较低时,可以使用前 面的特征来训练分类器(图中策略 C); • 当新数据集比较小且和原数据集相似度较高时,可以使用预 训练 02640.pdf 行为分类:在区分出待检测的各个学生后,就需要对学生当 前行为进行识别与分类。通常而言,最简单的行为识别就是 以单一视频帧为对象,然后利用 CNN 对其进行识别,但这种 方法在画面比较复杂时,如人物有遮挡、重叠时会受到较大 干扰,准确性不高。为提升准确率,许多基于 CNN 网络扩展 的优化方案应需而生,例如 Two-Stream(双流)类方法、 C3D 方法以及 CNN-LSTM 计的行为分析方案设计” 部分)。如图 2-2-13 所示,典型课 堂动作行为的发生往往没有很清晰的分割边界,图中许多学生 的手都处于一种似举非举的模糊状态。面对这一场景,如果采 用“帧统计”方式,结果准确度可能比较差。而采用按事件统计 的方式,则可以明确表示一次举手行为的发生,结果完全不受 动作模糊状态的影响。 例如在一些实践部署中,方案采用 “2+3” 模式(即 2 个模 型是基于英特尔® 架构处理器、310 积分 | 40 页 | 4.85 MB | 9 月前3
基于大数据的全域旅游综合管理平台的设计与应用布机制,定期发布文化消费及旅游消费数据,通过宏 观数据形成市场预期。 未来,随着人工智能算法及大模型的不断完善, 可在此基础上结合模型对数据进行更智能的研判,公 布区域消费结构、消费趋势等指标数据,横向比较同 类区域的旅游产业发展,纵向比较当地区域的动态历 史变化,使产业主体能够多维度、全方位地掌握市场 动态 [13]。旅游企业通过整合政府数据资源和行业自 身数据积累,对消费群体进行精准画像,将有效信息 快10 积分 | 5 页 | 1.30 MB | 3 月前3
共 65 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7
