积分充值
 首页  上传文档  发布文章  登录账户
维度跃迁
  • 综合
  • 文档
  • 文章

无数据

分类

全部人工智能(36)前沿探索(36)

语言

全部中文(简体)(36)

格式

全部PDF文档 PDF(28)PPT文档 PPT(7)DOC文档 DOC(1)
 
本次搜索耗时 0.071 秒,为您找到相关结果约 36 个.
  • 全部
  • 人工智能
  • 前沿探索
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • PPT文档 PPT
  • DOC文档 DOC
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页

    爆火,其能力已接近人类水平。GPT 升级至四代,模型能力 高速提升。2023 年 3 月 15 日,OpenAI 正式官宣了多模态大模型 GPT- 4,ChatGPT4 将输入内容扩展到 2.5 万字内的文字和图像,较 ChatGPT 能够处理更复杂、更细微的问题。最新版的 GPT-4 在 ChatGPT 的 GPT- 3.5 基础上主要提升了语言模型方面的能力,并添加了多模态功能,在 不同语言情景和内部对抗性真实性评估的表现都显著优于 AI 分析后的结果。传统安防产业在产品、 技术与应用等多维度实现了更深层次的进化与变革。2、人工智能亦将 更加广泛地应用到智能制造行业中,机器视觉检测是 AI 技术在智能制 造中最好的落脚点之一,AI 图像增强技术、AI 缺陷检测算法等技术的 发展有望提升机器检测效率,从而逐步代替人工目检。 ◼ 投资建议: AI 产业链条长,各环节机遇频现,AI 应用的发展将是推动 产业链上下游共同繁荣的动力,相关标的梳理如下:1、终端品牌:传音 ........................................................................... 13 图 23: Meta SAM 可以实现图像切割 ................................................................................................
    10 积分 | 28 页 | 2.68 MB | 6 月前
    3
  • pdf文档 DeepSeek大模型及其企业应用实践

    Vision,CV)领 域中使用的大模型,通常用于图像处理和分析。 这类模型通过在大规模图像数据上进行训练,可 以实现各种视觉任务,如图像分类、目标检测、 图像分割、姿态估计、人脸识别等。代表性产品 包括VIT系列(Google)、文心UFO、华为盘古 CV、INTERN(商汤)等 是指能够处理多种不同类型数据的大模型,例如 文本、图像、音频等多模态数据。这类模型结合 了NLP和CV的能力,以实现对多模态信息的综合 据来自互联网上的大量文本,因此,它能够涵盖多种 语言风格和文化背景 2.1 国外的大模型产品 n Gemini Gemini是谷歌发布的大模型,它能够同时处理多种类型的数据和任务,覆盖文本、图像、音频、视频等多个领域。Gemini 采用了全新的架构,将多模态编码器和多模态解码器两个主要组件结合在一起,以提供最佳结果 Gemini包括三种不同规模的模型:Gemini Ultra、Gemini Intelligence)的时代。 AGI是指能够像人类一样进行各种智能活动的机器智能,包括理解语言、 识别图像、进行复杂推理等。Sora大模型能够直接输出长达60秒的视频, 并且视频中包含了高度细致的背景、复杂的多角度镜头,以及富有情感 的多个角色。这种能力已经超越了简单的图像或文本生成,开始触及到 视频这一更加复杂和动态的媒介。这意味着人工智能不仅在处理静态信 息上越来越强大,而且在动态内容的创造上也展现出了惊人的潜力
    10 积分 | 147 页 | 16.82 MB | 6 月前
    3
  • pdf文档 电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页

    开始普及,3)隐私保护需求 推动办公用 PC AI 化等三大机会。 具备记忆、推理、规划、执行能力的 AI Agent 可能是大模型的最终形态 大模型的应用能力最初功能仅限于文字问答,此后逐渐引入图像理解、文生 图功能,并通过 GPT Store 拓展功能,形成了 AI Agent 雏形,近期 GPT-4o 则实现了具备情感的互动。用户数方面,根据 Similarweb,24 年 5 月 ChatGPT AR/VR 被认为有望替代手机成为下一代移动终端。但由于缺少触摸屏,人 机交互困难一直是困扰其发展的一大难点。从最近谷歌推出的 Project Astra 以及 Meta 的雷朋眼镜中我们看到,大模型所具备的图像理解、语音交互, 以及根据语音交互结果进行的执行能力有望大幅度提高 AR 眼镜的交互能 力。目前具身智能的发展仍处于非常早期的阶段,但是大模型所具备的以上 能力有望大幅提高机器人对环境的理解能力,以及根据理解结果控制关节等 年初,主流闭源大模型通常为纯文本的 LLM。2023 年至今,闭 源模型的多模态能力具有大幅度提升,目前主流闭源大模型通常具备图像理解、图像生成 能力。部分最前沿的闭源大模型,例如 GPT-4o、谷歌 Gemini,支持的模态更加多元,能 够理解文本、图像、音频、视频(帧),并生成文本、图像、音频。2022 年 9 月,红杉资 本预计还需要近十年的时间,大模型才能实现实习生级别的代码生成、好莱坞质量的视频
    10 积分 | 40 页 | 2.60 MB | 6 月前
    3
  • pdf文档 AI医疗专题:从AIGC角度看医药产业图谱

    代的全新信息系统入口。此前,Meta 在2023年4月5日发布了机器视觉领域首个用于图像分割的通用大模型 Segment Anything Model(SAM)及其训练数据集 Segment Anything 1-Billion(SA-1B),并将其开源于 GitHub。该模型的推出促进了机器视觉通用基础大模型的进一步研究,为图像分割领域的研究和应用提供更加完备 的解决方案,也逐步让我们看到了更多的AIGC在医药医疗端应用的潜在可能。 GC: 对信息 进行创造性 生产 AGI:多场景处理与自我学习 ASI: 全面超越人类的人工智能水 平 文本:文字+代码信息内容加工 音频:音频内容加工创作 图像(静态):图片处理+图片 制作 图像(动态):视频处理+3D模 型加工 ChatGPT 实体经济的AIGC: 新产品、新流程、新药物的 智能设计生成 文化艺术的AIGC: 广告、动漫、影视、绘画、 音乐、儿童教育的智能内容生成 画图 写代 码等 意图识别 情感分析 问答 文本生成 图片生成 声音生成 图片生成 文本表示 图像表示 大语言模型(LLM) SAM的开源将促进机器视觉通用大模型的进一步研究 8  Meta 在 4 月 5 日发布了机器视觉领域首个用于图像分割的通用大模型 Segment Anything Model(SAM)及其训练数据集 Segment Anything
    10 积分 | 50 页 | 5.74 MB | 6 月前
    3
  • pdf文档 从DEEPSEEK的崛起看AI医疗发展方向及投资机会

    种“模型即服务”的生态闭环,不仅重构了医疗工作流,更催生了 六大核心应用方向的爆发:  AI 医学影像辅助诊断:进入发展快车道,辅助诊断为主。包括AI超声诊断、病理学AI等影像学辅助诊,涉及到图像处理、勾勒病灶大小、特 征识别、诊断建议。影像学AI辅助诊断商业化落地快,应用场景明确,院端需求较大。数据获取成本较高,行业正在探索AI收费模式。相关 标的:联影医疗、理邦仪器、万东医疗、一脉阳光、 收集样本基因测序、 罕见病遗传病分析解读 多组学风险预测和评估 AI 制药 分子虚拟筛选、药物发现 优化药物结构 临床试验优化 建立疾病风险模型 肿瘤精准治疗 AI 医学影像 图像处理、 勾勒病灶大小、 特征识别、诊断建议 AI 健康管理 可穿戴设备 定制化干预方案 AI系统实时监测并预警 商业化落地进度 数 据 获 取 成 本 资料来源: GC: 对信息 进行创造性 生产 AGI:多场景处理与自我学习 ASI: 全面超越人类的人工智能水 平 文本:文字+代码信息内容加工 音频:音频内容加工创作 图像(静态):图片处理+图片 制作 图像(动态):视频处理+3D模 型加工 实体经济的AIGC: 新产品、新流程、新药物的 智能设计生成 文化艺术的AIGC: 广告、动漫、影视、绘画、 音乐、儿童教育的智能内容生成
    10 积分 | 62 页 | 6.64 MB | 6 月前
    3
  • pdf文档 信通院:“机器人+人工智能”工业应用研究报告2025

    升大规模智算训练效率。在硬件方面,高性能 GPU、专用 AI 芯片、 高速互联网络、大容量高速存储等技术,实现了大规模的算力供给, 为处理复杂、不规则的计算任务(如自然语言处理的长序列数据、计 算机视觉的多尺度图像特征)创造了条件;在软件方面,分布式训练 框架、预训练大模型、多模态数据处理等技术也通过精细化算力管理 提升了大模型的训练和推理速度,为机器人的大规模应用提供了基础 支撑。 2 (二)“机器人+人工智能”是新一轮大国竞争的关键 能阶段,机器人只能执行简单的预设任务,缺乏自主性和适应性;第 二阶段是基础智能阶段,机器人开始具备基本的感知能力,能够对外 界环境做出简单的反应;第三阶段是中等智能阶段,机器人能够进行 更复杂的感知和处理任务,如图像识别和语音识别;第四阶段是高度 智能阶段,机器人展现出较高的自主性和适应性,能够进行自我学习 和优化,执行复杂的任务;第五阶段是超级智能阶段,机器人理论上 将具备超越人类的智能水平,能够进行创新和自我意识的决策。 在工业领域,机器人的规模化应用正在从中度智能向高度智能过 渡。随着深度学习算法的优化以及多模态感知技术的融合,工业机器 人将具备更强大的感知、认知和决策能力,能够更加精准地识别复杂 环境中的物体、声音和图像,理解人类的语言和意图。同时,工业机 器人将具备更强的自主学习能力,能够根据环境变化和任务需求进行 自我调整和优化。从模型架构来看,结构相对简单、参数较少的机器 学习模型正在转化为多层级、大参数量的深度学习、强化学习模型,
    0 积分 | 37 页 | 2.06 MB | 5 月前
    3
  • pdf文档 人形机器人行业:由“外”到“内”,智能革命-

    质量检测、电路 检测等; 仓储物流:精准定位抓取货物、质量检测、搬运装卸、应急 处理与异常检测等。 智能制造场景 特种作业场景 智能制造 • 产品检测:利用视觉系统、激光测距仪、高清摄像头与图像处理算法有效实现外观检测、尺寸检测、功 能检测、寿命检测等功能,提高其精确度与可重复性。 • 精准装配:通过灵活多变的机械手臂和精细的手指运动,实现人类难以企及的速度和精度完成各项装配 任务。实时调整策略应对不确定因素 ,经过芯片的处理后,发出指令给执 行机构,从而实现对机器人运动的控制。随着AI技术的发展,AI芯片在人形机器人 中的应用越来越广泛,如英伟达Tegra。这些芯片用于执行AI算法,可以处理语音 识别、图像识别、NLP、逻辑控制等任务,提升机器人的人机交互能力和智能水平。 • 目前国内外厂商控制器在硬件部分差别不大。但在软件部分,尤其在核心算法上, 国外企业凭借时间积累的优势,在反应速度、兼容性等方面表现更优。例如,国产 觉实现绝大部分感知功能。根据图像数据的维度,机器视觉可分为2D和3D两大类。2D技 术能获取平面图像,并在二维空间内定位目标,但无法提供物体的三维信息,如深度信息,且容易受到光照变化和物体运动的影响。 相比之下,3D技术能提供更全面的物体信息,从而实现人脸识别、3D建模等更复杂的功能。 • 机器视觉的运行包括以下几个步骤:①利用视觉设备捕获待检测物品的图像 ②由图像处理系统将物品的亮度、颜色、尺寸等信息转换
    0 积分 | 49 页 | 3.78 MB | 5 月前
    3
  • pdf文档 从原则到实践:在动态监管环境下负责任的人工智能

    如何应对复杂的法律环境就成为了一个巨大的挑战。本文深入探讨了围绕人工 智能的监管环境,涵盖了诸如生成逼真文本格式(代码、脚本、文章)的深度 学习模型、处理视觉内容(面部识别、深度伪造)的计算机视觉应用、稳定扩 散(文本到图像模型)以及在自主系统(自动驾驶汽车、机器人)中使用的强 化学习算法等多样化系统。更广泛的类别,如生成式对抗网络和大语言模型等, 是众多生成式人工智能应用的基础,要求在监管中将其纳入考虑。由于现行立 授予消费者有关其个人信息 的特定权利,包括访问、删除、更正其个人信息以及拒绝个人信息被出售的权 利。具体内容如下: ● 知情权:要求披露为训练模型而收集和使用个人信息的详情,包括说明用于 训练的数据类别(如文本、图像、音频或姓名、位置等),确定个人信息的来 源(如用户互动、购买/第三方数据集、社交媒体、公共记录等),详细说明个 人信息的用途(如模型训练、性能评估等)。 ● 访问权:用户可以要求访问在训练数据中使用到的具体数据点,训练过程 ©2025 云安全联盟大中华区版权所有 36 2. 如何应对生成式人工智能的幻觉对数据隐私、安全和伦理的 影响 幻觉是指人工智能系统根据其所训练的模式和数据生成逼真但与事实不符或 捏造的输出,如图像、视频或文本。这些幻觉引起了人们对关于数据隐私和安全相 关立法和法规的极大关注。 生成式人工智能幻觉影响的一个关键领域是数据隐私。当生成式人工智能模型 被输入敏感数据时,有可能产生无意中泄露个人或组织的私密信息,这给一些监管
    10 积分 | 72 页 | 1.37 MB | 6 月前
    3
  • ppt文档 电子AI+系列专题:复盘英伟达的AI发展之路

    Hidden Layers 768 1600 12288 l 随着互联网时代对于数据量的积累,大数据背景下神经网络成为机器学习的重要方法。 2012 年,深度卷积神经网络 AlexNet 凭借在图像分类识别领域中性能的大幅提升及错误率 的 大幅降低,成为人工智能的标志性事件。 l 在此过程中,其训练者 Alex Krizhevsky 创新性地使用英伟达 GPU 成功训练了性能有突破性 。 lGPU ( Graphics Processing Unit , 图 形 处 理 器 ) 能 够 并 行计 算的 性 能优势满足深度学习需求。 GPU 最初承担图像计算任务, 目标是提 升计 算机对图形、图像、视频等数据的处理性能,解决 CPU 在图形图 像领域 处理效率低的问题。由于 GPU 能够进行并行计算,其架构本身 较为适合 深度学习算法。因此,通过对 GPU 的优化,能够进一步满足 )计算的 CUDA 平台。软件开发者可以通过 该平台 使用 C 语言编写 GPU 片上程序来完成复杂的计算。从 G80 开始,英伟达 GPU 体 系结构已经全面 支持通用编程, GPU 实际脱离图像处理的单一用途,成为了真正的通用 GPU 。 l 自 2015 年以后,随着 AI 浪潮迅猛推进,公司业务不断多元化,向数据中心、游戏、移动 设备、汽车电子等市场发展。 2017 年,公司专为数据中心和高性能计算打造
    10 积分 | 30 页 | 1.27 MB | 6 月前
    3
  • ppt文档 AI在保险行业的发展和应用(32页 PPT)

    AIGC 时代,业务员的朋友圈展业助手 1 7 大模型与保险营销 智能文生图 输入:描述文本 输出:智能生成与输入内容相关的结果图 自研文本编码器和文生图模型,更好支持在中文输入场景进行图像创作。 智能图生图 输入:图片,以及辅助的描述文本 输出:智能生成与输入内容相关的结果图 提供原图风格转换支持与原图相似度参数调节。 prompt :一个透明 女孩,金色头发, 精致脸蛋,粒子效 塔,远处是连绵起 伏的 山脉 prompt :君不见黄 河 之水天上来 1 8 AIGC 时代,让每一个营销活动都和“我”相关 1 9 大模型与保险营销 基于分割、融合、 3D 等技术,实现对图像或视频中的人物提取以及再加工,实现人脸融合效果,支持 API 、 SDK 和离线服务 等方式 高精度人脸融合服务 视频人脸融合 图片人脸融合 实时融合 用户照 素材图 融合图 2 0 AIGC 现实域 对落地的业务场景来说,模型并非越大越好,而是需要根据实际业务场景来选择适合的模型 2 5 多场景数据标注 小样本模型训练 零代码应用编排 全方位智能评测 图像干扰 勾选、手写、背景、印章、打印偏移等 复杂关系 混合版式、表格结构化、多层级关系、勾选框提取、易混淆字段提取、无 Key 字段提 取 智能结构化 版式 5000+ 泛化准确率 90%+ 5
    10 积分 | 32 页 | 941.17 KB | 2 天前
    3
共 36 条
  • 1
  • 2
  • 3
  • 4
前往
页
相关搜索词
电子行业电子行业深度报告AI系列降本增效降本增效拓宽应用硬件落地场景丰富20230712东吴证券28DeepSeek模型及其企业企业应用实践需要什么什么样20240621华泰40医疗专题AIGC角度角度看医药产业医药产业图谱DEEPSEEK崛起发展方向投资机会信通机器机器人人工智能人工智能工业研究2025人形革命原则动态监管环境负责复盘伟达保险保险行业32PPT
维度跃迁
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传,所有资料均作为学习交流,版权归原作者所有,并不作为商业用途。
相关费用为资料整理服务费用,由文档内容之真实性引发的全部责任,由用户自行承担,如有侵权情及时联系站长删除。
维度跃迁 ©2025 | 站点地图 蒙ICP备2025025196号
Powered By MOREDOC PRO v3.3.0-beta.46
  • 我们的公众号同样精彩
    我们的公众号同样精彩