积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(131)行业赋能(61)前沿探索(36)大模型技术(25)技术工具(6)基础设施(3)

语言

全部中文(简体)(131)

格式

全部PDF文档 PDF(58)PPT文档 PPT(44)DOC文档 DOC(29)
 
本次搜索耗时 0.025 秒,为您找到相关结果约 131 个.
  • 全部
  • 人工智能
  • 行业赋能
  • 前沿探索
  • 大模型技术
  • 技术工具
  • 基础设施
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页

    爆火,其能力已接近人类水平。GPT 升级至四代,模型能力 高速提升。2023 年 3 月 15 日,OpenAI 正式官宣了多模态大模型 GPT- 4,ChatGPT4 将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。最新版的 GPT-4 在 ChatGPT 的 GPT- 3.5 基础上主要提升了语言模型方面的能力,并添加了多模态功能,在 不同语言情景和内部对抗性真实性评估的表现都显著优于 AI 分析后的结果。传统安防产业在产品、 技术与应用等多维度实现了更深层次的进化与变革。2、人工智能亦将 更加广泛地应用到智能制造行业中,机器视觉检测是 AI 技术在智能制 造中最好的落脚点之一,AI 图像增强技术、AI 缺陷检测算法等技术的 发展有望提升机器检测效率,从而逐步代替人工目检。 ◼ 投资建议: AI 产业链条长,各环节机遇频现,AI 应用的发展将是推动 产业链上下游共同繁荣的动力,相关标的梳理如下:1、终端品牌:传音 ........................................................................... 13 图 23: Meta SAM 可以实现图像切割 ................................................................................................
    10 积分 | 28 页 | 2.68 MB | 6 月前
    3
  • pdf文档 英特尔-工业人工智能白皮书2025年版

    • 质量管理:产品缺陷检测是质量管理的重要一环,尤 其是对于金属等高反光产品、薄膜产品的划痕、裂 纹、凹坑、气孔、污染等非常难检出的外观缺陷,利 用传统视觉算法,对工业相机采集到的图像经过预处 理,基于图像分割等深度学习模型,高效且较为准确 地检出缺陷,为传统的视觉检测技术赋予高度智能 化。质量检测也是目前 AI 技术在工业领域落地应用 较多、较为成功的一个方向。 • 智能生产管理: 时检 测要求,使得效率和准确率低下且容易漏检的人工质检和容易受复杂环境光干扰的传统机器视觉检测方法无法胜 任。将 AI 视觉算法技术与机器视觉成像技术相结合,利用经过缺陷图像训练的深度学习模型识别工业相机捕获的 缺陷图像,满足终端检测节拍要求 24 秒/轮毂,提高检测精度和生产线效率。 08 01 工业人工智能 (AI) 行业观察 以智能手机、平板电脑、笔记本电脑等为主导的消费电子产品以及生产制造,也是 秒/件之间,甚至更快。 传统的人眼检测,不但无法达到微小缺陷的检测精度要求,而且人眼容易疲劳,存在效率低、误检漏检偏高等问题, 无法满足生产的精度和节拍要求。将深度学习算法与高精度成像系统相结合,更快速地识别出产品图像中的缺陷及 种类,满足生产线对检测精度和速度的要求。 锂电池的质量直接关乎电动车的安全性,因此锂电对质检要求严苛。锂电生产过程中的检测工序繁多,包括原料生 产中的隔膜缺陷检测,前段工序中的极片
    0 积分 | 82 页 | 5.13 MB | 5 月前
    3
  • pdf文档 DeepSeek大模型及其企业应用实践

    Vision,CV)领 域中使用的大模型,通常用于图像处理和分析。 这类模型通过在大规模图像数据上进行训练,可 以实现各种视觉任务,如图像分类、目标检测、 图像分割、姿态估计、人脸识别等。代表性产品 包括VIT系列(Google)、文心UFO、华为盘古 CV、INTERN(商汤)等 是指能够处理多种不同类型数据的大模型,例如 文本、图像、音频等多模态数据。这类模型结合 了NLP和CV的能力,以实现对多模态信息的综合 据来自互联网上的大量文本,因此,它能够涵盖多种 语言风格和文化背景 2.1 国外的大模型产品 n Gemini Gemini是谷歌发布的大模型,它能够同时处理多种类型的数据和任务,覆盖文本、图像、音频、视频等多个领域。Gemini 采用了全新的架构,将多模态编码器和多模态解码器两个主要组件结合在一起,以提供最佳结果 Gemini包括三种不同规模的模型:Gemini Ultra、Gemini Intelligence)的时代。 AGI是指能够像人类一样进行各种智能活动的机器智能,包括理解语言、 识别图像、进行复杂推理等。Sora大模型能够直接输出长达60秒的视频, 并且视频中包含了高度细致的背景、复杂的多角度镜头,以及富有情感 的多个角色。这种能力已经超越了简单的图像或文本生成,开始触及到 视频这一更加复杂和动态的媒介。这意味着人工智能不仅在处理静态信 息上越来越强大,而且在动态内容的创造上也展现出了惊人的潜力
    10 积分 | 147 页 | 16.82 MB | 6 月前
    3
  • ppt文档 DeepSeek大模型赋能高校教学和科研2025

    GPT 系列 ( OpenA I ) 、 Bard ( Google ) 、 DeepSeek 、文心一言 (百度)等 多模态大模型 是指能够处理多种不同类型数据的大模型,例如 文本 、 图像 、音频等多模态数据 。这类模型结 合 了 NLP 和 CV 的能力, 以实现对多模态信息 的综合 理解和分析,从而能够更全面地理解和 处理复杂 的数据 。代表性产品包括 DingoDB midjourney 等 视觉大模型 是指在计算机视觉( Computer Vision , CV )领 域中使用的大模型 ,通常用 于图像处理和分析 。 这类模型通过在大规模图 像数据上进行训练, 可 以实现各种视觉任务 , 如图像分类 、 目标检测 、 图像分割 、姿态估计 、人脸识别等 。代表性产品 包括 VIT 系列 ( Google ) 、文心 UFO 、华为盘古 CV 、 INTERN 因此 , 它 能够涵盖多种 3.6.1 国外的大模型产 品 语言风格和文化背景 n Gemini Gemini 是谷歌发布的大模型 , 它能够同时处理多种类型的数据和任务 , 覆盖文本、 图像、 音频、 视频等多个领域。 Gemini 采用了全新的架构 ,将多模态编码器和多模态解码器两个主要组件结合在一起 , 以提供最佳结果 Gemini 包括三种不同规模的模型: Gemini
    10 积分 | 123 页 | 15.88 MB | 6 月前
    3
  • word文档 AIGC生成式AI大模型医疗场景应用可行性研究报告(152页 WROD)

    .......................................................................................49 4.2.1 医学图像处理.............................................................................51 4.2.2 影像生成与增强... 当前,面对全球医疗资源紧张、临床决策复杂化等挑战,传统 医疗模式已无法满足日益增长的患者需求。医务人员需要在短时间 内处理海量的信息并做出决策,这无疑增加了医疗风险。生成式大 模型通过自然语言处理、图像生成等技术,可以在多方面为医疗应 用提供支持。 首先,生成式大模型可以应用于临床诊断辅助。通过分析患者 的症状、实验室结果及影像学资料,这些模型能够生成初步的诊断 建议。这不仅提高了诊断的准确性,还可以减少医生的工作负担。 生成式大模型概述 AI 生成式大模型,正如其名称所示,是通过深度学习技术训练 的复杂模型,能够基于输入数据生成新的内容。这些模型广泛应用 于自然语言处理、图像生成、语音识别等多个领域,尤其在医疗场 景中展现出良好的应用潜力。通过海量医学文本、图像和结构化数 据进行训练,AI 生成式大模型能够理解并生成专业的医疗信息,辅 助医疗决策、提供个性化医疗服务、以及改善患者的整体体验。 首先,生成式大
    60 积分 | 159 页 | 212.70 KB | 4 月前
    3
  • pdf文档 电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页

    开始普及,3)隐私保护需求 推动办公用 PC AI 化等三大机会。 具备记忆、推理、规划、执行能力的 AI Agent 可能是大模型的最终形态 大模型的应用能力最初功能仅限于文字问答,此后逐渐引入图像理解、文生 图功能,并通过 GPT Store 拓展功能,形成了 AI Agent 雏形,近期 GPT-4o 则实现了具备情感的互动。用户数方面,根据 Similarweb,24 年 5 月 ChatGPT AR/VR 被认为有望替代手机成为下一代移动终端。但由于缺少触摸屏,人 机交互困难一直是困扰其发展的一大难点。从最近谷歌推出的 Project Astra 以及 Meta 的雷朋眼镜中我们看到,大模型所具备的图像理解、语音交互, 以及根据语音交互结果进行的执行能力有望大幅度提高 AR 眼镜的交互能 力。目前具身智能的发展仍处于非常早期的阶段,但是大模型所具备的以上 能力有望大幅提高机器人对环境的理解能力,以及根据理解结果控制关节等 年初,主流闭源大模型通常为纯文本的 LLM。2023 年至今,闭 源模型的多模态能力具有大幅度提升,目前主流闭源大模型通常具备图像理解、图像生成 能力。部分最前沿的闭源大模型,例如 GPT-4o、谷歌 Gemini,支持的模态更加多元,能 够理解文本、图像、音频、视频(帧),并生成文本、图像、音频。2022 年 9 月,红杉资 本预计还需要近十年的时间,大模型才能实现实习生级别的代码生成、好莱坞质量的视频
    10 积分 | 40 页 | 2.60 MB | 6 月前
    3
  • pdf文档 基于大模型的具身智能系统综述

    甚至进行诗歌和故事的创作; BLIP (Bootstrapping language-image pre-train- ing)[10]、BLIP2[11]、GPT4-V[12] 等视觉−语言大模型则 能对图片进行图像分割[13]、目标检测[14]、视觉问答 (Visual question answering, VQA)[15]; DINO (De- tection transformer with improved (Contrastive language-im- age pre-training)[17]、SAM (Segment anything model)[18] 等视觉基础模型则以低于前两者的模型 量级提供跨越图像与文本鸿沟的能力, 为进行实时 的开放词汇的视觉检索提供了可能. 这一系列的进 展不仅展示了基础模型的强大潜力, 也为其与具身 智能的融合提供了新的视角和可能性. 文献 [19] 将 上述在大规模数据集上进行训练并能适应广泛任务 捕获各模态之间的关系, 提取为统一的高维特征, 形成对世界的理解. 如对大量无标签的互联网文本 和图像进行预训练的视觉模型, 能将图像与文本编 码到同样的向量空间中, 这种对齐不仅有利于对环 境的感知, 也有利于对用户自然语言指令的理解, 利于完成复杂的任务. 本节主要讨论各类将大模型 用于具身智能感知与理解的方法, 讨论范围是文本、 图像和音频等信息, 其中感知的信息来源于环境与 人类用户. 1.1 多模态模型理解
    20 积分 | 19 页 | 10.74 MB | 2 天前
    3
  • ppt文档 大模型在自然资源规划管理中的探索与实践

    绿色低碳 底线守护 N 个 智 能 体 应 用 行业业务微调 业务价值对齐 检索增强 算力基础 知识图谱 文本 规则模型 环境 图文对 视频图像 实体分类 空间 边 缘 计 算 高性能存储 专业 AI 芯片 Gpu 算力 …… 整治修复 土地利用 行业 知识 语料 大模型构建平台 行业 大模 型 业 务 智 能 体 政 113 国土资源部办公厅关于加强全国矿产资源潜力评价成果管… .2025/3/619:28 训练语料 样本库 多模态理解微调 特定任务标注 正反例百条 图文对 多模态理解模型微调 图像 / 视频 + 文本描述 ( 十万 级 ) 多模态 QA 结果排序 ( 万 级 ) 问答对 大语言模型微调 千条 ~ 万条 QA 对 形成宁波市自然资源行业知识库,为城市大模型建设提供权威行业语料 国土资源部办公厅关于印发《土地权属争议案件文书格式… 2024/2/215:26 要素识别提取 图像理解扩写 视频分类 视 频 OCR 视频理解扩写 深 加工 解析 版面分析 Chunk 切分 文档结构树 公式解析 图表理解 表格解析 图像解析 图像分类 语义标注 专 题 知 识 . 语 料 处 理 数据治理
    10 积分 | 38 页 | 12.05 MB | 5 月前
    3
  • ppt文档 智能制造关键技术(虚拟现实与人工智能技术)

    互式的三维动态视景 和实体行为的系统仿真,能够使用户沉浸到该环境中。 虚拟现实是一种环境,是高度现实化的虚幻。在其应用的领域中,为能 达到虚拟现实这种环境而综合运用计算机图形学、图像处理与模式识别、计 算机视觉、计算机网络/通信技术、语音处理与音响技术、心理/生理学、 感知/认知科学、多传感器技术、人工智能技术以及高度并行的实时计算技 术等多方面技术,营造出一个虚拟环境( 立体声、网络传输、语音输入输出技术等。 ( 1 )实时三维计算机图形 相比较而言,利用计算机模型产生图形图像并不是太难的事情。如果有足够准 确的模型,又有足够的时间,我们就可以生成不同光照条件下各种物体的精确 图像,但是这里的关键是实时。例如在飞行模拟系统中,图像的刷新相当重要, 同时对图像质量的要求也很高,再加上非常复杂的虚拟环境,问题就变得相当 困难。 5 ( 2 )显示 )显示 在 VR 系统中,双目立体视觉起了很大作用。用户的两只眼睛看到的不同图像 是分别产生的,显示在不同的显示器上。有的系统采用单个显示器,但用户带上特 殊的眼镜后,一只眼睛只能看到奇数帧图像,另一只眼睛只能看到偶数帧图像,奇、 偶帧之间的不同也就是视差就产生了立体感。 在用户与计算机的交互中,键盘和鼠标是目前最常用的工具,但对于三维空间 来说,它们都不太适合
    20 积分 | 24 页 | 4.03 MB | 4 月前
    3
  • ppt文档 AIoT物联网+智慧旅游整体解决方案

    多终端内容自动适配 Flash 展示引擎 移动 GIS 浏览器 高效图像压缩 云业务支撑平台 图像挖掘与处理 ...... 多源、多尺度、多实相时空数据模型 三维实景影像 地理测绘 卫星数据 其它数据库 ....... 三维全景 影像采集车 基于垂直搜索 引擎的旅游信 息内容汇聚 面向移动终端 的图像数据采 集 卫星遥感 影像数据采集 ....... 智慧旅游 转 换 接 入 根 据 数 据 维 护 工 具 数 据 版本 控 制 工 具 业务数据 游客流量、门票、酒店、 餐饮监测数据 属性数据 园景、建筑、文化、胜迹、历史文化数据 图像数据 景区自然、环境、人文、社会等摄影图片 图形数据 景观资源、文化、基础设施数据 基础数据 矢量地图、三维模型、全景视图、景区规划介绍、文化遗产 数据 元数据 元数据(来源、格式、精度 . 智能视频监控 公共智能广播 游客智能疏导 智慧管理 – 智能视频监控 业务功能 图像监控 存储回放 报警联动 音频对讲 增值功能 多画面监控 多画面轮巡 云镜控制 远程控制 录像检索 本地回放 远程回放 客户端存储 报警输入 中心存储 控制输 出 前端存储 移动侦 测 个性化功能 图像抓拍 图像识别 电子地图 双向对讲 广播喊话 网闸穿越 环境监控 3G 网 关
    10 积分 | 83 页 | 26.27 MB | 6 月前
    3
共 131 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 14
前往
页
相关搜索词
电子行业电子行业深度报告AI系列降本增效降本增效拓宽应用硬件落地场景丰富20230712东吴证券28英特特尔英特尔工业人工智能人工智能白皮皮书白皮书2025年版DeepSeek模型及其企业企业应用实践赋能高校教学科研AIGC生成生成式医疗可行研究可行性可行性研究152WROD需要什么什么样20240621华泰40基于具身系统综述自然资源自然资源规划管理探索制造关键技术关键技术虚拟现实虚拟现实AIoT联网智慧旅游整体解决方案解决方案
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩