北大:DeepSeek-R1及类强推理模型开发解读o1 路上的核心理念,并且效果还好到受到了 OpenAI 的认可 如何通过有效的 Test-Time Scaling 和 Train-Time Scaling 提升模型的推理能力? 得益于纯大规模强化学习 , DeepSeek-R1 具备强大推理能力与长文本思考能力,继开源来备受关注。 DeepSeek R1-Zero 和 R1 的出现再次证明了强化学习的潜力所在: R1-Zero 8 大规模推理为中心的强化学习,提升模型数学代码能力 RL 驱动下自然涌现长文本推理能力 基于规则的奖励 Rule-Based Reward 推理为中心的大规模强化学习 Large-Scale Reasoning-Oriented RL DeepSeek-R1-Zero 9 基于规则的奖励 (Rule-Based Reward) : 准确率奖励 + 格式奖 励 推理为中心大规模强化学习:组相对策略优化( GRPO ) + 瞄准 Reasoning 推理任务 自我迭代提升 Self-Evolution : 随着训练步数的增长,模型的 thinking response10 积分 | 76 页 | 6.72 MB | 5 月前3
基于埃威互联技术的能源管控方案(27页 PPT)从而实现更加灵活和全面的信息化管理。通过大量终端信息的采集结合大数据分析,做出更 加明智的决策。 WWW.SHAV.CN 多连接通信能 力 • 需对工业现场 的设施进行控 制, 结合定位 及传感器数据 进行精准联动。 大规模采集能 力 • 需大量的采 集工业现场的 数据信息, 提升数字化信 息收集能力。 高系统扩展能 力 • 需不断根据 业务情况不断 增加功能, 持续提升系统 功能 低功耗待机能 力 议芯片,开发了具有大规模、多连接、低 功耗、高精度等优点的埃威互联 ® 技术, 解决了其他通信技术无法在限定区域进行 大规模有源部署的局限,是面向数字化新 需求的物联网解决方案 关键技术:大规模多连接物联网通信技术 埃威互 联技术 高精度定位能力 单基站可实现亚 米级实时定位。 多连接通信能力 单基站可同时与 1000+ 终端双向 通信。 大规模采集能力 单基站可同时进 定制自定义协议芯片, 开发了具有大规模、 多连接、高精度、低功耗等优点的埃威互联 ® 技术, 解决了其他通信技术无法在限定 区域进行大规模有源部署的局限, 是面向工业互联多节点数字化管理新需求的物联网 解决方案。 • 满足了工业现场对于无线的、低成本的、长时间的、大规模的数据采集通信的需求。埃 威互联 ® 技术, 可以用一台基站实现: 3000+ 大规模终端物理量信息采集 \1000+10 积分 | 27 页 | 10.07 MB | 1 天前3
钢铁行业SAP解决方案单修正功能;基于特征属性的源批次管理、基于特征属性的库存 查询、钢材分切管理功能、件次管理功能、基于特征属性的批次 管理、质量检验数据的分配功能、基于特征属性的订单合并功能 等等 特定要求:中国钢铁企业信息化建设的大背景 1. 大规模联合重组。 2. 企业改制,建立现代企业制度。 3. 产品生产结构调整。 中国钢 铁业信 息化所 面临巨 大挑战 4. 信息化基础比较薄弱。 需要一套怎样的信息化管理系统 全面:必 实现信息化的钢铁企业 模式一 : 大规模定制 模式一 : 大规模定制 模式二:大规模集成跨行业通用商业软件+大 量定制 模式二:大规模集成跨行业通用商业软件+大 量定制 模式三 : 实施钢铁版商业软件 + 少量定制 模式三 : 实施钢铁版商业软件 + 少量定制 SAP 对钢铁行业信息化建设总体技术路线的建议 大规模集成 + 大量开发 采用商业软件 采用商业软件 + 大量开发 采用钢铁版商业软件 + 少量开发 80 年代初 80 年代中 90 年代中 今天 大规模开发 蒂森克虏伯之路 : 钢铁版商业软件 + 少量开发 美钢联之路 : 大规模开发 浦项之路 : 大规模集成商业软件 + 大量开 发 未来 改进大规模开发技术 90 年代末 三大模式的形成过程 世界钢铁企业信息化道路一:全定制开发 新日铁:全定制 JFE :全定制20 积分 | 81 页 | 4.26 MB | 5 月前3
金融-DeepSeek银行部署加速,AI金融应用迎来跃迁泰 证 券 研 究 所 n DeepSeek 开源使金融机构能够轻松获得前沿模型能力,且大幅降低部署成本。其通过对训练方式、算法架构和推理方 法 的工程化优化大幅降低了部署成本。近期采用大规模 RL 训练方法的阿里 QwQ-32B 等模型也在缩小规模的同时达到了 DeepSeek R1 671B 的应用效果,有望进一步催生银行落地应用。 n 我们认为金融行业人工智能的应用价值大体可以分为三个层次: 技术落地不及预期、竞争加剧、信息更新不及时等。 2 核心观点 DeepSeek 开源、低成本、强推 理 助推银行业应用 1 n DeepSeek 模型在 Post-Train 阶段大规模应用了强化学习方法。 R1 使用了冷启动 + 大规模强化学习方法, R1-Zero 版 本模 型使用纯强化学习方法。随训练过程推进,模型展现出了推理能力的扩展(高准确率和 long-CoT 能力涌现等) 。 图表:随步数提升 图表:随步数提升 R1-Zero 的 AIME 任务准确度 图表:深度思考能力提升 性能:后训练阶段大规模应用强化学习,表现推理能力扩展 资料来源: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning ,中泰证券研究所10 积分 | 25 页 | 1.44 MB | 1 天前3
2024年汽车AI大模型TOP10分析报告(59页 PPT)Big-data Driven ,模型基于大规模语料训练而成; Multi-tasks Adaptive ,支持多种任务 ,包括自然 语言生成 NLG 和自然语言理解 NLU 类的任务; AI 大模型就是预训练语言模型 通过在大规模宽泛的数据上进行训练后能适应一系列下游任务的模 型 产业研究 战略规划 技术咨询 ,在少甚至无标注样本的 条件下支持推理(自监督学习)。 将模型在下游各种自然语言处理任 务上的小规模有标注数据进行微调 得到适配模型 预训练语言模型 从海量数据中自动学习知识 将模型在大规模无标注数据上进 行自监督训练得到预训练模型 不同特定任务 有标注训练数 据 模型预训练 模型微调 最终模型 ⼤规模⽆标注 ⽂本数据 预训练语⾔模型“预训练 + 微调”技术范 式 13 来源:面壁智能公众号 文心一言沿袭了 ERNIE 3.0 的海量无监督文本与大规模知识图谱的平 行 预训练算法 ,模型结构上使用兼顾语言理解与语言生成的统一预训 练框 架。为提升模型语言理解与生成能力 ,研究团队进一步设计了可 控和可 信学习算法。 结合百度飞桨自适应大规模分布式训练技术和“鹏城云脑Ⅱ ”领先算力 集群 ,解决了超大模型训练中的多个公认技术难题。在应用上10 积分 | 59 页 | 27.94 MB | 1 天前3
智能制造案例与实施路径说:“第一 眼看见就很喜欢,没想到他 们做的这么 用心。” 成本低 效率高 交货快 标准化 产品单一 成本高 效率低 交货慢 个性化 品种多 大规模定制 互联网时代的冲击 --- 个性化与大规模制 造 个性化制造 大规模制造 编号 互联对象 互联点 互联价值 1 内外 互联 用户 订单 物流 产品 模块商 用户定制 - 服务体验互联 用户参与设计、在线个性化定制自己的产品。 沈阳冰箱工厂是海尔第一个智能互联工厂,可支持 9 个平台 500 个型号的柔 性 大规模定制,人员配置减少 57% ,单线产能提升了 80% ,单位面积产出 提升 了 100% ,定单交付周期降低了 47% ,成为全球生产节拍最快的冰箱 工厂。 郑州空调互联工厂拥有由 11 个通用模块和 4 个个性模块组成的 200 多种用户 柔 性定制方案,而传统的工厂只能大规模、少品类地生产,难以满足用户个 性化 的需求。 佛山工厂采用 为用户提供产品定制全流程的良好体验。 海尔互联工厂:用户与利益攸关方全流程可视 互联工厂实现的基础条件: 模块化 自动化 智能化 互联工厂实现的基础条件之一:模块化 海尔颠覆传统制造模式,构建以用户为中心的大规模个性化 定制模式,其中模块化是实现用户定制的基础。 产品 模块化案例:海尔匀冷冰箱由原来 354 个零件整合为 24 个模 块 匀冷冰箱开发新品,上市时间减少 30% ,成本下降 18% ,加工工时减少了10 积分 | 50 页 | 4.51 MB | 6 月前3
智慧电力综合监控平台整体解决方案是下了很大决心的,实际进度也是很快的,在理论上也完全 不落后美国。” 3 . 发展意义 智能电网的 意义 (一)满足经济社会发展对电力的需求 通过建设坚强智能电网,提高电网大范围优 化配置资源能力,实现电力远距离、大规模 输送,满足经济快速发展对电力的需求。 (四)满足多元化用电服务需求 通过建设坚强智能电网,提高电能质量和供电 可靠性,创新商业服务模式,提升电网与用户 双向互动能力和用电增值服务水平。 和电网运行控制智能化,提高电力系统资产的 运营效益和全社会的能源效率,促进经济社会 的可持续发展。 (二)应对资源环境问题带来的挑战 通过建设坚强智能电网,实现可再生能源 集约化开发、大规模、远距离输送和高效 利用,改善能源结构,促进资源节约型、 环境友好型社会建设。 3 . 发展意义 十二五:智能电网全面建设期 第一阶段 (2009~2010 年 ) 第二阶段 (2011~2015 安全 清洁 经济 互动 优质 在设备、人身和计算机攻击 防护方面更加安全 在设备、人身和计算机攻击 防护方面更加安全 分布式能源即插即用 可再生能源大规模应用清洁 能源市场优化电网运行 分布式能源即插即用 可再生能源大规模应用清洁 能源市场优化电网运行 减少用户费用 提高电网设备利用率 利用低成本发电机组 减少用户费用 提高电网设备利用率 利用低成本发电机组 预见故障,快速反应10 积分 | 29 页 | 5.46 MB | 6 月前3
面向新型电力系统的数字孪生技术数学的建模技术以及最新 的 传感器数据 , 可以实现对机器未来状态 的预 测 ,从而实现基于状态的运营维护 可视性 让运营者从数字角度看到机器以 及大规模系统的运行状态 , 从而 实现对机器及大规模系统的实时 监控和高效管理 Oracle, “Digital Twins for IoT Applications,” 2017 年东北部停电),受影响人数约有 3000 万人, 207,000 平方公 里,停电时长达 13 小时。 1970s ,能量管理系统诞生,包括数据收集、能量管理、网络 分 析和调度员培训等功能。开始大规模使用仿真分析工具进行 电力 系统运行管理。 传统电力系统仿真与数字孪生 Department of Electrical Engineering 电机工程与应用电子技术系 21 必须仿真 + 控制器在环 + 功率在环仿真分析工具; 重 大 需 求 电力电子设备的加入造成微秒级 ~ 秒级动态的相互影响; 大规模交直流互联造成电网局部故障影响的大范围传播; 新能源渗透率的不断提高引入大量不确定性; 亟需大规模电网高性能(计算规模、计算时间、批量处理能力) 电磁暂态仿真工具。 大电网运行 国防建设 构建电力系统数字孪生的关键技术 高性能仿真计算技术10 积分 | 46 页 | 11.09 MB | 3 月前3
电子AI+系列专题:复盘英伟达的AI发展之路成为数据中心发展关键。 据 IDC 数据,全球数据总量预计由 2021 年的 82.47 ZB 上升至 2026 年的 215.99 ZB , 对应 CAGR 达 21.24% 。其中,大规模张量运算、矩阵运算是人工 智能在计算层面的 突出需求,高并行度的深度学习算法在视觉、语音和自然语言 处理等领域上的广 泛应用使得算力需求呈现指数级增长。 据 Cisco 数据,全球数据中心负载任务量预计由 资料来源:金十数据,国信证券经济研究所整理 表:不同技术架构 AI 芯片比较 种类 定制化程度 可编辑性 算力 价格 优点 缺点 应用场景 GPU 通用型 不可编辑 中 高 通用型较强、适合大规模并行运算;设计和制造工艺成熟。 并行运算能力在推理段无法完全发挥。 高级复杂算法和通用性人工智能平台。 FPGA 半定制化 容易编辑 高 中 可通过编程灵活配置芯片架构适应算法迭代,平均性能较高;功耗较低; 件。 lGPU 在训练负载中具有绝对优势。据 IDC 数据, 1H21 中国 AI 芯片市场份额中, GPU 占比高达 91.9% ,依然是实现数据中心加速 的首选。 GPU 通用型较强、适合大规模并行运算,设计和制造工艺成熟,适用于高级复杂算法和通用性人工智能平台。 lAI 芯片又称 AI 加速器或计算卡,是专门用于处理人工智能应用中大量 计算任务的模块。随着数据海量增长、算法模型趋向复杂、处理对象异0 积分 | 30 页 | 1.27 MB | 6 月前3
电子AI+系列专题:复盘英伟达的AI发展之路成为数据中心发展关键。 据 IDC 数据,全球数据总量预计由 2021 年的 82.47 ZB 上升至 2026 年的 215.99 ZB , 对应 CAGR 达 21.24% 。其中,大规模张量运算、矩阵运算是人工 智能在计算层面的 突出需求,高并行度的深度学习算法在视觉、语音和自然语言 处理等领域上的广 泛应用使得算力需求呈现指数级增长。 据 Cisco 数据,全球数据中心负载任务量预计由 资料来源:金十数据,国信证券经济研究所整理 表:不同技术架构 AI 芯片比较 种类 定制化程度 可编辑性 算力 价格 优点 缺点 应用场景 GPU 通用型 不可编辑 中 高 通用型较强、适合大规模并行运算;设计和制造工艺成熟。 并行运算能力在推理段无法完全发挥。 高级复杂算法和通用性人工智能平台。 FPGA 半定制化 容易编辑 高 中 可通过编程灵活配置芯片架构适应算法迭代,平均性能较高;功耗较低; 件。 lGPU 在训练负载中具有绝对优势。据 IDC 数据, 1H21 中国 AI 芯片市场份额中, GPU 占比高达 91.9% ,依然是实现数据中心加速 的首选。 GPU 通用型较强、适合大规模并行运算,设计和制造工艺成熟,适用于高级复杂算法和通用性人工智能平台。 lAI 芯片又称 AI 加速器或计算卡,是专门用于处理人工智能应用中大量 计算任务的模块。随着数据海量增长、算法模型趋向复杂、处理对象异10 积分 | 30 页 | 1.27 MB | 6 月前3
共 252 条
- 1
- 2
- 3
- 4
- 5
- 6
- 26
