积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(180)行业赋能(88)前沿探索(46)大模型技术(25)基础设施(17)技术工具(4)

语言

全部中文(简体)(180)

格式

全部PDF文档 PDF(92)DOC文档 DOC(44)PPT文档 PPT(44)
 
本次搜索耗时 0.037 秒,为您找到相关结果约 180 个.
  • 全部
  • 人工智能
  • 行业赋能
  • 前沿探索
  • 大模型技术
  • 基础设施
  • 技术工具
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • DOC文档 DOC
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • word文档 自动智慧运维管理平台技术方案(115页 WORD)

    管理上划分优先级是被普遍认可的方式,优先级划分能实现管理投入的合理分配,对于运维 管理同样适用,通过对资源按照所在业务重要度区分其对应的管理等级,比如关乎生产系统的资 源划分成一级,内部办公系统相关资源划分成二级设备;对于一级设备意味着更为密集的数据采 集和更低的阈值,对于异常更为敏感,故障处理上要求更为严格,后期的管理数据统计需要单独 ഀ� 列项统计。 常规运维软件中仅仅是对于将管理对象简单的划分了不同等级,仅是为了界面上进行统计, 界面上进行统计, 没有落实到具体运维过程中;真正落地的等级化管理必须要做到如下几点:  按照业务划分管理资源  实现对于不同等级资源不同的监控周期和预警阈值  对于不同等级资源定义不同预警等级和处置方案  对于不同等级资源进行不同角度的统计和报表分析  能便捷的调整等级,并应用相应等级的管理规则 智慧运维平台以等级为核心进行管理区分,内置不同等级的管理解决方案,从下到上贯彻等 通过系统提供的智能策略机制,将用户对于某些异常分析的人工方式自动化,比如对于主机 高负载原因的排查,一般的操作逻辑是确定主机负载超过风险阈值情况是偶发事件还是一直存在, 然后分析每一次出现高负载的进程是否一致,通过人工智能找到具体的异常进程,关闭该进程或 者卸载相关软件,同时对于该进程的设定预警,达到事前预警;智慧运维平台通过策略实现这一 系列动作,包括对历史记录多点对比,对于进程的记录,异常进程的智能判断,乃至告警的建议;
    110 积分 | 75 页 | 36.47 MB | 1 月前
    3
  • word文档 AI知识库数据处理及AI大模型训练设计方案(204页 WORD)

    是关键,包括但不限于企业内部的文档数据、互联网公开数据、第 三方数据库以及用户生成内容。对于每种数据来源,需建立明确的 数据采集标准和流程,确保数据的合法性和合规性。 数据采集完成后,需进行初步的数据清洗。这一步骤包括去除 重复数据、纠正明显的错误、填补缺失值以及统一数据格式。例 如,对于日期格式不一致的情况,需将其统一为 ISO 8601 标准格 式。同时,对于文本数据,需进行分词、去除停用词、统一大小写 等处理,为后续的自然语言处理任务奠定基础。 等处理,为后续的自然语言处理任务奠定基础。 在数据清洗的基础上,需进行数据标注和分类。对于结构化和 半结构化数据,可采用自动化工具进行标注,如使用正则表达式匹 配特定模式。对于非结构化数据,尤其是文本数据,需借助人工标 注或半自动标注工具,确保标注的准确性和一致性。标注过程中, 需制定详细的标注规范,以减少标注误差。 数据标注完成后,需进行数据增强和扩展。通过数据增强技 术,如图像数据的旋转、缩放、翻转,或文本数据的同义词替换、 句式变换,可以增加数据集的多样性和规模。同时,对于特定领域 的知识库,可通过爬取相关领域的最新公开数据或引入专家知识, 进一步丰富数据集。 接下来是数据安全与隐私保护。在处理数据时,需严格遵守相 关法律法规,如《个人信息保护法》和《数据安全法》。对于包含 个人敏感信息的数据,需进行匿名化或脱敏处理。同时,需建立数 据访问权限控制机制,确保只有授权人员能够访问和操作数据。 数据的存储和管理也是关键环节。对于大规模数据,建议采用
    60 积分 | 220 页 | 760.93 KB | 5 月前
    3
  • word文档 DeepSeek智能体开发通用方案

    中,需确定是否 支持多语言处理、语义理解深度以及实时性要求。 其次,非功能性需求同样不可忽视。这包括系统的响应速度、 并发处理能力、可用性、安全性以及可扩展性。例如,对于实时交 互场景,系统响应时间应控制在毫秒级别;对于大规模部署场景, 系统应具备良好的水平扩展能力,以应对用户数量的增长。 此外,用户体验需求是智能体能否成功落地的关键因素。需要 明确用户界面的设计原则、交互方式以及反馈机制。例如,在对话 其丰富的生态系统和高效的科学计算库(如 NumPy、Pandas、Scikit-learn)成为首选。对于需要高性能计算 的部分,可以考虑使用 C++或 Rust 进行优化。在框架选择 上,TensorFlow 和 PyTorch 均适用于深度学习模型的开发,但 PyTorch 因其动态计算图和更灵活的调试能力,更适合快速迭代和 实验。 对于数据处理和存储,Apache Spark 和大数据生态系统(如 Hadoop)是处理大规模数据的理想选择,而 Cython 等工具进行性能优化,满足高效计算的需求。 然而,对于需要更高性能和更低延迟的场景,C++是一个不错 的选择。C++提供了更底层的控制能力,适用于开发核心算法和性 能敏感模块。通过结合 Python 和 C++,可以利用各自的优势: Python 用于快速开发和集成,C++用于优化关键路径的性能。 此外,对于分布式任务和并行计算,Go 语言因其简洁的语法 和强大的并发支持,也是一个值得考虑的选择。Go
    0 积分 | 159 页 | 444.65 KB | 4 月前
    3
  • word文档 AI大模型人工智能数据训练考评系统建设方案(151页 WORD)

    集的训练过程,同时具备动态资源分配功能,根据训练任务的复杂 度自动调整计算资源。此外,系统应内置多种优化算法,如 Adam、SGD 等,并提供超参数调优功能,允许用户通过网格搜索 或贝叶斯优化等方式自动寻找最优参数组合。 对于数据预处理,系统需支持常见的数据格式(如 CSV、JSON、图像、视频等),并提供数据清洗、归一化、特征工 程等预处理模块,确保训练数据的高质量。系统还应具备数据增强 功能,特别是针对图像和文本数据,支持随机裁剪、翻转、旋转、 为了提高训练效率,系统应支持断点续训功能,允许用户在训 练中断后从最近一次保存的模型状态继续训练,避免重复计算。同 时,系统需提供模型版本管理功能,允许用户保存和管理不同训练 阶段的模型,便于后续评估和部署。对于大型训练任务,系统应支 持分布式数据存储和读取,减少数据传输时间,提高训练速度。 在模型验证方面,系统需支持交叉验证、留出验证等多种验证 方法,并可根据需求自动划分训练集、验证集和测试集,确保模型 面,系统应具备自动化监控和告警功能,能够实时监控 CPU、内 存、磁盘等资源使用情况,并在异常情况下自动发送告警信息。 此外,系统还需具备良好的用户体验。界面设计应简洁直观, 操作流程应尽可能简化。对于非技术用户,系统应提供详细的操作 指南和在线帮助,降低学习成本。在多语言支持方面,系统应至少 支持中文和英文两种语言,并可根据用户需求灵活扩展其他语言。 最后,系统应具备良好的兼容性和可移植性。硬件方面,系统
    60 积分 | 158 页 | 395.23 KB | 5 月前
    3
  • pdf文档 2025中国RFID无源物联网行业产业白皮书-161页

    无源物联网,是指没有采用电源(电池或者电线),而是通过采集环境中的微弱能量就能正常工作的物联网设备。 人们常说,“水乃生命之源”,而能量,则是驱动 IoT 设备工作的源头。在人类的发展史上,能源占据着举足轻重的地 位,目前人们对于能量的采集、存储与使用已经炉火纯青,以至于很多人都忽视了它的存在,而在 IoT 产业中,能量技术 在产业的地位也在迅速提升。 近些年涌现出来的 NB-IoT、LoRa 等新兴传输技术一个最主要的 能量,也可以传输信号,让系统非常的简洁,同时还 能节省成本,减小尺寸等。 第二种常见的就是采集太阳能 / 光能供电,太阳能供电可以获取较大的电能,但是系统较复杂,成本高,在某些场景 适用,但是对于大规模,低成本的物联网应用场景而言,明显是不适用的。 第三种,就是按压式发电,通过机械力改变材料的形变而产生电流,这种方式也有一些比较适用的场景,比如说开 关,遥控器等,但这种需要直接动手的方式,在大多数的场景中也不适合。 设备如果脱离了电池的束缚,可以做到更小的尺寸与更灵活的形态,甚至是柔性贴片式的形态,以方便应用。 此外,没有电池也可以降低很大比例的成本,尤其是对于很多低价格的产品而言,几毛钱的成本差异就会限制一大片 应用场景的使用。 物联网的愿景就是“万物皆可连接”,但对于很多低价格的产品比如矿泉水、零食、快递包裹等来说,产品的单价与利 润很低,采用电池连接,显然是不合适的。所以,采用低成本的无源连接方案成为释放千亿乃至万亿级连接量的必然之选。
    20 积分 | 161 页 | 13.17 MB | 1 月前
    3
  • pdf文档 生成式AI爆发:医疗人工智能走到新的十字路口-蛋壳研究院

    伴随 AI 应用的持续扩展与需方对于 AI 认知的不断加深,“提效”取代“政策”成为需方 购置 AI 的主要动力。如今,医疗 AI 企业已突破 1-2 亿的营收规模,迈向第一个 10 亿。 2. 超 160 个影像 AI 获批医疗器械三类证,影像 AI 企业们逐渐跳出影像科,向医学装 备、外科手术辅助系统等领域进发,打开了新的百亿市场。 3. 生成式 AI 对于医疗 IT 的重构已经初现成效。上百个大模型涌入医疗领域,许多 ........................................................................................3 1.3 部分主体对于医疗 AI 的购置态度...................................................................................... 3 ..1 图表 2 2016 年—2024 年涉及医疗 AI 的关键政策(下)..............................................2 图表 3 不同主题对于人工智能的需求差异...........................................................................6 图表 4 产品分布图(脏器分布+病种分布)
    10 积分 | 69 页 | 13.45 MB | 7 月前
    3
  • pdf文档 未来网络发展大会:2025量子互联网与算网协同体系架构白皮书

    同时存在。这种叠加态其实对于我们 生活在宏观世界的人来说很难想象。因为我们从出生到现在见到的世 界里的状态都是某一个确定的状态,比如光子要么处于水平偏振,要 么就是竖直偏振。一只猫,要么是死的,要么就是活的。同时处于死 和活的状态是一种什么样子,我们根本想象不出来。所以在量子力学 建立的早期,许多量子物理学家都很难接受其他人甚至自己提出的一 些理论带来的“奇怪”结论。其中对于叠加态的质疑就是著名的薛定谔 当纠缠态被测量时,其结果会出现关联。而这两种结果出现的概率由 量子态中的系数决定的。例如对于纠缠态α|00 +β|11 ,测量后的结果 总是两个白色朝上(00),或者两个黑色朝上(11)。而得到这两个结 果的概率分别为 α 2和 β 2。对于纠缠态α|01 +β|10 ,结果总是一黑一 白,也就是 01 或者 10。 对于两比特的最大纠缠态,我们叫做 Bell 态(Bell state),其有 四种情况,分别表示为: −|11 ), |Φ+ = 1 2 (|01 +|10 ), |Φ− = 1 2 (|01 −|10 ). 这四个 Bell 态是量子信息中经常用到的纠缠态,后续内容也会经常涉 及。对于三比特的纠缠态,常见的有 GHZ(Greenberger-Horne-Zeilinger) 态,也就是|GHZ = 1 3 (|000 ± |111 )。n 比特 GHZ 态的表达式为 10
    20 积分 | 94 页 | 5.28 MB | 1 月前
    3
  • pdf文档 运营商智算中心建设思路及方案

    EFLOPS。若采用 910B(376 TFLOPS@FP16) 集群,按照 GPU 利用率为 30%,训练 28 天,则需要约 1 150张910B GPU卡。 按照上述测算,对于万亿参数模型,则需要万卡 级规模集群;对于十万亿参数模型,则需要十万卡级 规模集群。因此,为了实现通用人工智能 AGI,国内外 互联网厂商纷纷开始“囤卡”。在算力需求倍增的同 时,带来如下挑战。 a)对显存容量和性能的挑战。GPU F/(单卡算力× GPU利用率×训 练限制时间) 单位和解释说明 - 一个英文单词即可认为是 一个Token,汉字可认为是 一个Token;通常为百万级 FPLOPS,浮点计算次数。 对于训练算力,一般认为是 16位浮点计算次数 张,用来衡量GPU卡数量。 其中GPU利用率一般为 30%~75% 童俊杰,申 佳,赫 罡,张 奎 运营商智算中心建设思路及方案 数据通信 Data a)对数据访问性能的挑战。一方面是大量小文 件带来的元数据访问挑战,另一方面则是海量小文件 并发快速读取、Checkpoint 周期保存参数对数据存取 带来的挑战。 b)多模态数据统一访问的挑战。对于视频和图 片多模态数据输入,会对原始文件进行特征提取并以 小文件的形态保存,因视频和图片原始特征复杂,处 理后数据量倍增。此外,为便于后续对多模态原始和 特征数据的存取,需要建立相应的快速检索机制和内
    10 积分 | 6 页 | 3.64 MB | 1 月前
    3
  • pdf文档 大数据基础平台建设方法

    = 接入业务系统 对于大数据管理平台与接入业务系统之间进行 数据交换方式的规定,就是企业服务规范 制定企业服务规范的步骤  分析系统数据交换形式及流程  根据分析结果确定服务及事件清单  综合编码规范确定服务及事件的输入输出 内容 场景样例1  某集团,下属200多家分子公司,其中包括 子集团  集团总公司对于子公司无法全权控制,系统 集团设置运营部负责货品及客商统计维度类 别划分 特征分析  分子公司存在异构系统,不可统一  允许分子公司直接增加数据  分子公司增加的数据需要集团进行核准  集团对于数据的核准不能影响分子公司 业务的开展 常见数据交换形式1:多点维护、统一认证 分子公司 ERP系统一 集团大数 据管理系 统 服务 提供 组件 事件 触发 组件 客商 信息 过,则将本系统临时码更 新为正式码; 若为审批打回,则将打回 意见通知操作者,根据打 回意见修改数据后重新进 行申报提交。 场景样例2  某集团,下属20家分公司,10余家控 股子公司  集团总公司对于分公司完全集中控制, 管理系统均为统一采购,生产系统独 立采购  企业所有人员由人力部门统一管理  客商、存货数据由生产、营销部门进 行录入,信息部门进行审核 特征分析
    10 积分 | 43 页 | 2.19 MB | 1 月前
    3
  • word文档 DeepSeek智慧政务数字政府AI大模型微调设计方案

    政务数据的重要来源。例如,教育部网站 (www.moe.gov.cn)提供了教育政策和统计信息,国家卫 生健康委员会网站(www.nhc.gov.cn)提供了卫生健康相关 数据。 5. 国际组织数据源:对于一些涉及国际比较的政务数据,可以参 考国际组织发布的数据。例如,世界银行 (www.worldbank.org)和联合国(www.un.org)提供了 全球范围内的经济、社会、环境等数据。 在选择数据源时,应注意以下几点: 过官方认证或权威机构发布的数据。  数据格式:选择易于处理和转换的数据格式,如 CSV、JSON、XML 等。避免使用难以解析的格式。  数据更新频率:选择定期更新的数据源,以确保数据的时效性。 对于历史数据,应确保其覆盖的时间范围足够广泛。  数据权限:确保数据的使用权限合法,避免涉及敏感信息或侵 犯隐私的数据。 通过以上选择和注意事项,可以为政务大模型的微调提供高质 量、多样化的数据支持。 质量,去除 噪声数据、重复数据和无效数据。对于政务领域的数据,特别需要 关注数据的准确性和一致性。数据清洗流程包括以下几个关键步 骤: 1. 去除重复数据:通过哈希算法或相似度计算,识别并删除重复 记录,确保每条数据的唯一性。例如,在政府公文数据集中, 可能存在多份内容相同的文件,需要通过文本相似度算法进行 去重。 2. 处理缺失值:对于关键字段缺失的数据,可以根据上下文信息 进
    0 积分 | 167 页 | 464.82 KB | 6 月前
    3
共 180 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 18
前往
页
相关搜索词
自动智慧运维管理平台技术方案115WORDAI知识知识库数据处理数据处理模型训练设计设计方案204DeepSeek智能开发通用人工人工智能考评系统建设1512025中国RFID无源物联网行业产业白皮皮书白皮书161生成生成式爆发医疗走到十字路口十字路十字路口蛋壳研究研究院未来网络发展大会量子互联互联网算网协同体系架构运营营商运营商智算中心思路基础方法政务数字政府微调
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩