电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求为代表的传统神经网络模型、以 Transformer 为代表的 全新 神经网络模型、以 GPT 为代表的预训练大模型这三个时代的进阶,在“算力芯片、存储芯片”等硬件技术持续演进的支撑下,伴随模型参数规模超越千亿级,近年来人 工智能技术得以“涌现”出更加强大的理解、推理、联想能力。 图:模型规模的指数提升线性提高模型性能 资料来源 : Jared 等著 - 《 Sca l ing Laws for Neura 的数据量和参数规模呈现指数级增长,例如 GPT-3 模型参数约为 1750 亿,据 Semianalysis 推 测 GPT-4 参数量达 1.8 万亿;同时,国内目前公布的大模型参数规模也 普遍在百亿至千亿级 别。性能方面,据 Data Learner 数据, GPT-4o 在 MMLU 测评中获得 88.7 分的高分,分数较 GPT- 3 大幅提高;国产模型中阿里的 Qwen2.5-72B 取得0 积分 | 38 页 | 1.95 MB | 6 月前3
电子行业:AI大模型需要什么样的硬件?-20240621-华泰证券-40页Turbo。日日新 5.0 能力提升主要得益三个方面:1)采用 MoE 架构, 激活少量参数就能完成推理。且推理时上下文窗口达到 200K 左右。2)基于超过 10TB tokens 训练、覆盖数千亿量级的逻辑型合成思维链数据。3)商汤 AI 大装置 SenseCore 算 力设施与算法设计的联合调优。 免责声明和披露以及分析师声明是报告的一部分,请务必一起阅读。 35 电子 商汤推出“云、边、端”全栈大模型产品矩阵。1)云端模型即商汤最领先的基础模型系列。 2)在边缘侧,商汤面向金融、医疗、政务、代码四个行业推出商汤企业级大模型一体机。 一体机同时支持千亿模型加速和知识检索硬件加速,实现本地化部署,相比行业同类产品, 千亿大模型推理成本可节约 80%;检索大大加速,CPU 工作负载减少 50%,端到端延迟减 少 1.5 秒。3)端侧模型方面,SenseChat-Lite 1.8B 全面领先所有开源0 积分 | 40 页 | 2.60 MB | 6 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域号,硅星人公众号,东莞证券研究所 电子行业深度报告 21 请务必阅读末页声明。 中微软预计 Q1 及 Q2 支出与 24Q4 接近,Q3 及 Q4 将根据需求投资;亚马逊资本开支年化 有望超千亿;谷歌预计全年支出 750 亿美元,主要用于服务器,其次为数据中心和网络 建设;Meta 预计全年支出约为 600-650 亿美元,主要投向 AI 和核心业务。总体来看海 外 CSP 并没有因 DeepSeek0 积分 | 23 页 | 2.65 MB | 6 月前3
电子行业AI+系列专题:边缘AI,大语言模型的终端部署,推动新一轮终端需求-20230531-国信证券-25页时代的特征是通过海量数据,无需标注自监督学习,训练一个基础大模型, 并在各个应用领域将其专业化。具体来说有三个特点:1)对于拥有的超级海量的 数据,无需进行人工标注,即进行自监督学习;2)基础模型规模非常大,参数规 模从十亿到千亿级别;3)训练出的基础模型具有跨领域知识,而后通过微调用降 低成本的方法来训练,以适应不同领域的任务。AI 2.0 的巨大跃迁之处在于,它 克服了前者单领域、多模型的限制。 图1:AI2.0 时代0 积分 | 25 页 | 2.20 MB | 6 月前3
各省市低空政策汇编景牵引、培育低空制造生态 圈。 5. 强化低空制造要素支撑,强化无线电频谱资源统筹优化、促进行业内外合作交流、加大低空产业融资支 持。 2 陕西省 文件名称: 陕西省培育壮大 千亿级航空制造与低空产 业创新集群行动计划 发文时间: 2024/ 11/ 1 发文单位: 陕西省发展和改 革委员会 目标: 建设集研发设计 、生产制造 、试验验证 、服务保障于一体的航空制造与低空产业创新集群 加强统筹协调 2. 强化支撑保障 3. 加大资金投入 4. 加强合作交流 2. 陕西(陕西省、榆林) 115 序号 省 / 市 / 县 文件 主要内容 3 陕西省 文件名称: 陕西省培育壮大 千亿级航空制造与低空产 业创新集群行动计划 发文时间: 2024/ 11/ 1 发文单位: 陕西省发展和改 革委员会 目标: 不断提升陕西航空经济技术开发区 、秦创原无人机产业创新聚集区 、汉中航空经济技术开发区等0 积分 | 169 页 | 1.24 MB | 5 月前3
共 5 条
- 1
