积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部解决方案(48)信息基建(48)

语言

全部中文(简体)(46)

格式

全部DOC文档 DOC(18)PDF文档 PDF(15)PPT文档 PPT(15)
 
本次搜索耗时 0.024 秒,为您找到相关结果约 48 个.
  • 全部
  • 解决方案
  • 信息基建
  • 全部
  • 中文(简体)
  • 全部
  • DOC文档 DOC
  • PDF文档 PDF
  • PPT文档 PPT
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 金融业AI大模型智算网络研究报告

    、提升枢纽网 络传输效率、探索算力协同调度机制”的重点任务,明确通过“算 力+金融”加快算力在金融领域的创新应用,为金融业务发展提 供更为精准、高效的算力支持。 AI大模型智算网络技术是算力集群的重要基础底座,是新型 算力中的网络运载力,是助力大模型实现跨节点分布式训练,提 升大规模训练效率的重要支撑。 本文深入分析 AI 大模型技术在模型能力、结构、算力、效 率等方面的技术发展趋势,提出作为底座的智算网络所面临的新 多高效训练AI模型的方法出现。 AI大模型持续加速演进,其庞大的训练任务需要大量服务器 节点通过高速网络互联组成AI算力集群协同完成。但AI算力集群 并非通过简单算力堆叠即可实现完美线性扩展,而是取决于节点 间网络通信及集群系统资源调度能力。网络系统的性能及可用性 3 成为AI算力集群的线性度和稳定性的关键,也面临新的挑战: 一是高性能传输挑战。大模型需要大量的数据进行训练和推 理,千亿模型单 无法有效hash,高负载链路堵点概率极大。因此对网络负载均衡 4 调优、无损传输等提出了更高要求。同时大模型的训练和推理也 对网络的可靠性提出了更高要求,任何网络中断都可能导致训练 失败或推理错误,降低集群算力的效率。 三是高可维网络挑战。大模型单次训练时间在数天-月级。 训练期间如果出现网络不稳定的问题,会影响整个训练任务的进 度。且大模型训练环境涉及各软硬件组件配合,运维复杂。例如 Meta
    10 积分 | 33 页 | 1.70 MB | 3 月前
    3
  • ppt文档 美图-陈满意-美图数据中台建设实践(28页 PPT)

    集群资源无 法充分利用 集群存在低峰资源 利用时间 ,资源空 转, 同时集群对硬 件 CPU 、内存需求 不一致,可能导致 资源浪费 不同计算引 擎运行性能 存在差异 计算引擎差异导致 任务运行时间和资 Hadoop 云计算基建 HBase 智能计算引擎 资源调度 权限控制 成本计算 clickhouse 集群运维 spark kafka Mongo 服务层 云存储 presto flink SDK ES 美图大数据计算智能引擎 Presto 引擎 个性化设置 参数优化 权限控制 集群资源调度 Hadoop/Spark Yarn Presto Yarn Flink Yarn 云存储
    10 积分 | 28 页 | 1.14 MB | 2 月前
    3
  • pdf文档 华为AI数据中心参考设计

    2、机柜配电支持小母线或者配电柜 通道撬块 DC架构简介 钢构方案 34 RD15 IT负载: 15.2MW@50 kW/机柜 AI:16模块 丨 872 kW/模块 丨 3488 kW/厅丨 14MW/集群 园区渲染图 总体指标 总用地面积 13440㎡ 数据中心建筑面积 5450㎡(不含钢架平台、制冷机房面积) 总IT功率 15.2MW IT液冷机柜 50 kW/柜,16柜/模块,共256柜 kW/柜,30柜/模块,共120柜 设计等级 Tier III 备电/备冷时间 10 min 极限PUE 1.13 通用:4模块 丨 300 kW/模块 丨 600 kW/厅丨 1.2MW/集群 设计概况 RD15 配电系统 配电架构* IT:3DR*4 通用+动力:3DR 电力模块 IT:3.0MW*12 通用+动力:1.8MW*3 变压器 2500 kVA*15 柴油发电机 DG Diesel Generator Liquid supply Liquid Return 36 RD16 AI:36模块 丨 872 kW/模块 丨 5232 kW/厅丨 31.4MW/集群 园区渲染图 总体指标 总用地面积 15140㎡ 数据中心建筑面积 9996㎡(不含钢架平台、制冷机房面积) 总IT功率 33.8MW IT液冷机柜 50 kW/柜,16柜/模块,共576柜
    10 积分 | 61 页 | 14.22 MB | 1 月前
    3
  • ppt文档 某智慧工业园区总体解决方案(106页 PPT)

    谐与可持续发展已成 为影响社会未来发展的重要问题。加强化工园区内环保与安全一体化智能体系监管, 促进产业转型,已成为化工园区当前工作的重点所在。中国化工新材料(嘉兴)园区 作为全省首批 13 个产业集群“两化”深度融合实验区之一,按照“以信息化带动工业化, 以工业化促进信息化,走新型工业化道路”的要求,探索从政府、产业、企业三个层面 推进信息化和工业化的融合发展。 主席讲话 我国经 高附加值环节 管理城市化 满足日益复杂的 社会功能需求  港区化工园区是引领当地经济蓬勃发展的主力军;  2013 年,港区启动了“二次创业”三年行动计划;  浙江省首批 13 个产业集群“两化”深度融合实验区之一;  2015 年 9 月,《嘉兴港区港产城统筹发展三年行动计划 (2015-  2015 年 8 月,天津港危险品仓 库爆炸,社会影响恶劣;  2015 年 建设已有一百多年的 历史,化工上下游产 业和辅助产业高度关 联,建有完善的一体 化应急响应体系,园 区与各企业间安全、 环保及应急体系有效 衔接。 建设起步于上世纪 90 年代,已形成如 上海等化工园区产业 集群,但存在缺乏统 一规划、资源难共享 等问题,在发展模式 上未能形成集循环经 济、产业一体化及共 享辅助的产业簇群, 品牌效应不明显,在 软件建设管理方面更 是经验甚少。 国内化工园区 环氧乙烷
    20 积分 | 106 页 | 35.87 MB | 1 月前
    3
  • word文档 自动智慧运维管理平台技术方案

    ...............................................................................46 2.4.5.4. Oracle 集群管理.............................................................................................49 2 ⱻ17⼀82 疘ഀ ࠀ⨀⨀⨀⨀ꡒ 穦条킏ꅻٴ獞聢⽧륥䡨 各个磁盘、控制器的状态监管,并提供存储容量分析策略,实现主动分析,透明化监控;  虚拟化管理,包括对虚拟机中心、文件夹、数据中心、集群、宿主机、资源池、vApp 等 资源的全面管理和资源性能的智维分析。  机房管理,包括对温湿度探针、UPS 设备、空调设备、门禁、烟感、水浸、摄像头、机 柜等机房设备管理,提供机房的综合展现。 特征, 联合进程分析,进一步定位造成这两个问题的具体业务进程,为用户解决系统问题提供有数据、 有结论的原因定位; 系统对于数据存储的核心性能问题“内核延迟”“设备延迟”做了专项分析,另外对于集群、宿主 机、虚拟机、数据存储的 24 个关键性能指标提供自动分析,当发现异常越界比例过高时,系统会 主动以专题性分析报告的方式告知用户,列出历史分析数据,便于用户更深入了解问题本质 ,同 时
    10 积分 | 82 页 | 36.64 MB | 9 月前
    3
  • word文档 北塔BTSO智慧运维平台方案

    特征, 联合进程分析,进一步定位造成这两个问题的具体业务进程,为用户解决系统问题提供有数据、 有结论的原因定位; 系统对于数据存储的核心性能问题“内核延迟”“设备延迟”做了专项分析,另外对于集群、宿主 机、虚拟机、数据存储的 24 个关键性能指标提供自动分析,当发现异常越界比例过高时,系统会 主动以专题性分析报告的方式告知用户,列出历史分析数据,便于用户更深入了解问题本质 ,同 时 智慧运维平台建设方案 2.3.6.3.1. oracle-rac 管理 Oracle集群(rac)作为常见的oracle部署方式,结构复杂,管理能力要求高;BTSO通过图形 化展示方式,将rac的结构清晰展现给用户,同时列出重点性能信息,帮助企业用户能初步定为rac 系统的关键异常状态。BTSO支持oracle版本的集群体系,通过与部署主机、承载实例、控制软件 的分层管理实现清晰架构。通过整体方式 为规划调整提供对比数据。 2.3.6.4. 中间件管理 中间件管理对通用定义中间件的管理,包含了应用服务器、消息中间件的的管理,BTSO2.0 支持 MQ、webologic、websphere 的非集群管理;实现用户对于中间件的基本状态和承载业务的基本 状态监管。 支持对于管理信息的统计,包含授权点使用情况,各个数据库状态分布、各类型数据库熟练统计、 数据库等级统计。 MQ 管理:对于 MQ
    10 积分 | 70 页 | 12.52 MB | 9 月前
    3
  • pdf文档 2024全球计算产业应用案例汇编(GMVPS)

    技术的协同创新,将相距百公里的多个智算中心连成一个更大规模的智算集群,补齐单点算力规模不足 的差距。针对跨智算中心构建超大规模智算集群过程中遇到的问题和挑战,中国电信成立攻关项目组, 聚焦研究长距无损智算网络技术。 本方案依托中国电信的全光运力网,基于800G C+L技术、异构网络集合通信优化技术、全局负载 均衡技术等,为1024卡规模的分布式集群提供大容量带宽,实现120公里千亿参数大模型分布式训练, 80km/120km绕行拉远验证,模拟了两个数据中心组网,组网拓扑如图3所示。二阶段在武清、瀛海、永 丰三机房开展百公里分布式大模型训练,验证当前分布式智算中心无损网络解决方案在真实业务场景下 的效果,并探索分布式智算集群对大模型训练性能影响的关键因素,组网拓扑如图4所示。在前期百卡、 百公里拉远验证基础上,三阶段在京津冀智算机房开展了千亿参数、千卡规模120km两点拉远验证,组 网拓扑如图5所示,本阶段探索长距 了全球水平分辨率1km和全海深真实海洋环流模拟,成功地模拟了海洋中的中尺度和亚中尺度结构。 LICOMK++实现了多平台大规模高效并行,在使用Nvida GPU、国产类GPU、申威众核处理器及华为鲲鹏 CPU的集群上成功运行,性能均可达到或超越原生语言。在东方和新神威超算平台上,LICOMK++使用了 超万卡、千万核进行了大规模模拟,模拟速度均突破了1模式年每天(SYPD),取得了超越SOTA(state-
    10 积分 | 141 页 | 8.88 MB | 9 月前
    3
  • ppt文档 企业级大数据平台产品解决方案

    其他 数据总线 过滤清洗 关系型数据 库 2 Par t Mpp 数据库 格式规则转换 Hadoop 数据集成 字段映射 提供可视化数据建模挖掘工作台,依托大数据集群强大的计算能力,进一步提升租户对于海量数据的建模挖掘能力, 提高开发效率。 u 交互式开发界面支持:全流程、图形化、组件拖拽式的交互式开发能力,快速便捷 u 完善的算法调试支持:提供小批量数据运行、断点调试、模型参数调试等 大量的语音、图片、文本、视频 等非结构化数据还没有充分挖掘 利用 ⅹ SPSS 更偏向于数据统计方面应 用 , 很 难深层次挖掘数据价值 ⅹ 建模流程复杂,不友好 ⅹ 传统工具非集群模式,计算资源受制 于 用 户 电脑本身 ⅹ 没有模型保存 的功能, 导 致 模型无法很好的共享, 产生 重复工作和资源浪费 传统算法效果不佳 ⅹ 仅运用传统的机器学习算 法 (决策树、逻辑回归、随机 Security Center ) 为用 户 提供从业务运营到核心数据的安全保障 , 实现 全生命周期无侵入式的安全管控能力 ,大 数据安 全中心每一个功能模块 ,均可灵活组合。 集群账户总揽 集群资源总揽 数据定级视图 应 用 系统 运营监控 服务器运维报表 进程监控告警 服务器部署列表 输出 安全 应 用 系统日志 遵照规范 主动打印日志 无埋点式 自动收集日志 数据安全中心
    10 积分 | 30 页 | 2.97 MB | 9 月前
    3
  • word文档 智慧安监平台解决方案(148页 Word)

    3.1.2 语音中继备份..........................................................................11 4.1.3.1.3 集群对讲接入..........................................................................11 4.1.3.1.4 电话接入... 1.1 数据回传...........................................................................37 5.1.3.2.1.2 集群对讲...........................................................................37 5.1.3.2.1.3 视频对讲.. 基于以太网,本着将已有资源的最大化利用,为进一步建立、健全智慧安 监和应急协作机制,提高智慧安监应急协作效率,我司推出一套智慧安监应急 协作平台系统。该系统整合语音、视频监控/会议、指挥调度、集群对讲、GIS 业务、应急预案等系统,建立集语音、视频、数据三位于一体的全面应急指挥 协作平台,实现语音、视频、数据的融合与调度功能。 可基于以太网进行多级部署,可实现各级跨地区、跨部门之间的统一指挥
    20 积分 | 177 页 | 18.73 MB | 3 月前
    3
  • ppt文档 空间数据要素赋能低空经济应用(36页 PPT)

    多模型兼容支持,满足应用需求 影像分割 变化检测 目标检测 分布式集群计算,提升解译效率 分 布 式 解 译 计 算 集 群 示 意 图 影像管理 任务分发 GIS 计算 节点 GPU 节点 1 GPU 节点 2 GPU 节点 3 GPU 节 存储 节点 主存储 备份存储 800 集中式解译计算软件 600 分布式解译计算集群 400 200 500 20000 检 测 面 积 ( 平 方 公 里 ) 面向解译前、解译中、解译后,提供影像优化、分布式批量解译、交互式修整等能力。 无人机航片智能监测算法 分布式解译计算集群与集中式解译计算软件 解译效率对比图 GISTC 原始影像 色度匹配后影像 影像色度匹配 检测 用 时 ( 分 钟 ) Redis+RabbitMQ P17 存储管理 主 节 点
    20 积分 | 36 页 | 15.48 MB | 7 月前
    3
共 48 条
  • 1
  • 2
  • 3
  • 4
  • 5
前往
页
相关搜索词
金融金融业AI模型智算网络研究报告满意数据建设实践28PPT华为中心数据中心参考设计智慧工业园区工业园工业园区总体解决方案解决方案106自动运维管理平台技术北塔BTSO2024全球计算产业应用案例汇编GMVPS企业企业级产品安监148Word空间间数空间数据要素赋能低空经济36
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 - 2026 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩