北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 Pipeline Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 RL 算法的创新: GRPO 及其技术细节 DeepSeek-R1 背后的 Insights & Takeaways : RL 加持下的长度泛化 \ 推理范式的涌现 DeepSeek-R1 社会及经济效益 技术对比探讨 STaR-based Methods vs. RL-based \ o- series) 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及 Takeaways PRM & MCTS 的作用 从文本模态到多模态 其他讨论: Over-Thinking 过度思考等 未来方向分析探讨 模态穿透赋能推理边界拓展: Align-DS-V 合成数据及 Test-Time Scaling: 突破数据再生产陷阱 强推理下的安全:形式化验证 Formal10 积分 | 76 页 | 6.72 MB | 7 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告\ Kimi 1.5 及 类强推理模型开发解读 北大对齐小组 陈博远 北京大学2022级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 2 Outline ➢ DeepSeek-R1 开创RL加持下强推理慢思考范式新边界 ➢ DeepSeek-R1 Zero 及 R1 技术剖析 ➢ Pipeline 总览 \ DeepSeek-V3 Base \ DeepSeek-R1 Zero 及 R1 细节分析 ➢ RL 算法的创新:GRPO及其技术细节 ➢ DeepSeek-R1 背后的Insights & Takeaways:RL加持下的长度泛化 \ 推理范式的涌现 ➢ DeepSeek-R1 社会及经济效益 ➢ 技术对比探讨 ➢ STaR-based Methods vs. RL-based \ o-series) ➢ 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及Takeaways ➢ PRM & MCTS 的作用 ➢ 从文本模态到多模态 ➢ 其他讨论:Over-Thinking 过度思考等 ➢ 未来方向分析探讨 ➢ 模态穿透赋能推理边界拓展:Align-DS-V ➢ 合成数据及Test-Time Scaling: 突破数据再生产陷阱 ➢ 强推理下的安全:形式化验证10 积分 | 76 页 | 8.39 MB | 7 月前3
金融垂类大模型试用体验【AI金融新纪元】系列报告(一)【 AI 金融新纪元】系列报告(一) —— 金融垂类大模型试用体验 证券分析师:胡 翔 执业证书编号: S0600516110001 联系邮箱: hux@dwzq.com.cn 二零二四年一月二十五日 证券研究报告 1. 国内互联网企业、传统金融机构及金融科技企业争相竞逐 ,百模大战如火如荼。 2023 年 5 月中旬 ,奇富科技首先宣布推出自研的金融行业通用 大模型——奇富 ,相较于其他金融模型 拥有 更突出的推理、数学、编程等能力。 2024 年开年之初, 同花顺和东方财富分别推出问财 HithinkGPT 和妙想金融大模型, 内测火热进行中。 2. 金融垂类大模型赋能金融业务 ,推动行业业务实现增量提升。 目前各家公司都在致力于以大模型赋能股基 APP 或是金融终端 ,为已有功能注入 AI 能力 ,实现智能客服、智能投顾、智能风险等多场景应用 在金融科技支持政策陆续出台、海外金融垂类模型加速落地的背景下 ,我们认为金融垂类模型将成为金融科技领域未来的发展重点。我们认为, 具备较大金融交易数据基础、较好应用场景入口、较成熟 AI 技术运用经验的金融科技企业将受益明显 ,推荐【东方财富】、【同花顺】 ,建 议关注【恒生电子】。 5. 风险提示: 1 )监管环境趋严抑制行业创新; 2 )行业竞争加剧; 3 )权益市场大幅波动。 发布机构 金融垂类模型 共同优势10 积分 | 25 页 | 1.60 MB | 1 月前3
2025年基于LTE-V2X预警类应用的功能安全分析白皮书本研究基于 LTE-V2X 直连通信技术,对预警类应用的功能安全进行了系统分析。研究背景指出, 传统的功能安全分析方法主要针对单车系统,近年来 V2X 技术逐渐发展,智能网联汽车应用不断 增加,但缺乏系统性的功能安全分析方法。本研究选取前向碰撞预警(FCW)、交叉路口碰撞预警 (ICW)和闯红灯预警(RLVW)三个典型应用场景,对基于 LTE-V2X 预警类应用的功能安全分 析进行了技术探索。 5GAA 的 STiCAD 项目、中国汽 车工程学会的 T/CSAE 53 标准、汽标委的预警类应用技术要求和试验方法,以及 C-NCAP 2024 版 测试规程中的相关场景。本研究还对 V2X 预警类应用进行了分类,分为安全类和效率类应用,并 指出安全类应用与功能安全的相关性更大,因此本研究以安全类的三个典型应用场景为目标展开 分析。 在功能安全分析方法论部分,本研究基于 GB/T 34590 闯红灯预警(RLVW)应用,分别进行了相关项定义、潜在危害识别、ASIL 分析等工作,提出了 针对安全目标的功能安全要求。 在总结及展望部分,建议以本研究为开端,将 GB/T 34590 的功能安全分析方法拓展至 V2X 系统。 本研究的主要结论为:QM 级别的功能安全设计能够满足 V2X 预警类应用的需求。 2 / 32 Executive Summary This study conducts a systematic10 积分 | 34 页 | 3.26 MB | 7 月前3
2025大模型时代:类脑智能赋能电力应用场景的新模式研究报告10 积分 | 51 页 | 4.48 MB | 7 月前3
智慧工地应用指南及方案............................................9 1.2.4 应用范围及深度分析..................................................................11 1.2.5 实施效果及问题分析..................................................... ................66 3.6.1VR 或多媒体工具项进行安全教育/体验.......................................66 3.6.2 安全行为监控及安全报警提示系统.............................................67 3.6.3 深基坑监测系统.............................. 7%的项目在缺少领导督促的情况下完全不会使用智慧工地技术。 10 图 1-10 智慧工地使用情况 1.2.4 应用范围及深度分析 项目在人员管理方面的智慧工地模块,应用最多的是“劳务实名制平台”数 量 高达 474 个,覆盖率约 89.6%,其应用成熟度较高;其次是“基于生物识别的 人员信息采集及出入口管理”,有 397 个项目正在应用,覆盖率约 75%,成熟度 较高;然后是“基于网络或智能设备的10 积分 | 140 页 | 3.83 MB | 7 月前3
智慧水利行业实践及理解华为智慧水利行业实践及理解 2 Huawei Confidential 华为是全球领先的 ICT 基础设施和智能终端提供商 我们致力于把数字世界带入每个人、每个家庭、每个组织, 构建万物互联的智能世界 我们在通信网络、 IT 、智能终端和云服务等领域为客户提供有竞争力、安全可信赖的产品、解决方案与服务, 与生态伙伴开放合作,持续为客户创造价值,释放个人潜能,丰富家庭生活,激发组织创新。 研发员工 9 万 世界 500 强排名 72 国家和地区 170+ 品牌排名 68 员工 19.4 万 3 Huawei Confidential 聚焦 ICT 技术,面向三类客户群,提供产品解决方案和服务 消费者业务 全球标志性的科技品牌 运营商业务 客户最佳战略合作伙伴 企业业务 数字化转型的使能者 和最佳合作伙伴 云业务 做客户稳定可靠、安全可信、持续创 水利发展经过工程水利、资源水利、生态水利发展阶段,治水进入水利现代化阶段。通过优化、调整人类生产生活方式, 综合解决水多、水少、水脏、水混等水问题,实现减灾与兴利之间的动态平衡。 水利系统定位及职责使命经过强化提升,已从单一水工程建设运维,全面转向水工程运维、水资源供给、水生态补偿、 调蓄、水安全防护(水质保护、防汛应急)综合水资源治理。 工程水利 资源水利 生态水利 除害兴利 防洪抗旱、排涝、灌溉20 积分 | 21 页 | 17.17 MB | 6 月前3
智能体应用现状挑战及建议智能体应用现状挑战及建议 中国电子信息产业发展研究院 无线电管理研究所(未来产业研究中心) 二 O 二五年四月 ID CCID CCID CC ID CCID CCID CC CCID CCID CCID CCID CC ID CCID CCID CCID CCID 1 一、智能体概述 二、智能体发展现状 三、智能体发展动向与挑战 四、推动智能体发展的路径 等外部 信息 • 定义:智能体( AI Agent )是基于人工智能技术理解外部环境刺激并生成有意义动作的交互系统 ,涵盖环境感知、决策规划、 自主学习、 多 模态 交互及任务执行等关键技术。 自主学习和适应 智能体能够通过增强学习和迁移学习等方法从过往经验中学习并调整决策制定和行动过程 ID CCID CCID CC ID CCID CCID CC CCID 大语言模型先驱 ,持续优化智能体文本处理能力并推出 GPT Store ,拓展应用场景和商业模式。 IBM : 老牌技术领先公司 ,依托稳固客户关系推动 WatsonX 平台及智 能体发展 ,提供深度洞察并支持多云环境集成 ,助力企业构建 定制化智能体。 亚马逊云: 专注人工智能和云服务 ,通过智能体技术提升商业价值 ,更新 Bedrock 平台支持多种模型10 积分 | 9 页 | 1.03 MB | 1 月前3
数字创新园区建设及运维方案” 数字创新园区“ 建设及运维方案 目 录 01 园区智慧化建设背景 02 “ 数字创新园区”建设方案 03 “ 数字创新园区”运维方案 智能 运营 园区竞争 力和吸引 力增强 园区产业 服务水平 提升 园区运营管 理水平提升 大数据 移动 互联网 AI 人工智能 GIS IOT 物联网 BIM + 园区运营 成本降低 街景地图、 及雨雪、日升日落 天气特效展现。 ⚫ 园区突发事件模拟,应急辅助 分析研判、启动预案、处置资 源分析、联动等。 园区管理 -3- 综合态势管控系统 基于 CIM 的综合安防管理, AI+ 视频融合,杜绝安全隐患 ✓ 设备 分布 及基础信息 ✓ 视频访问 ✓ AI 视频分析 ✓ 人员出入统计 ✓ 告警及统计 略,根据运行的需要进行空间优化,帮助管 理者实现品质、成本和资产的精细化管理 ➢ 通过 BIM 模型实现对重要设备数据管理, 属 性查阅,维修、维护计划制定,智能告警, 设备 定 位,系统联动 园区及设施数字化,用能状况可视化 运维数据互通,能源智慧管控 基于数据分析,实现能源优化, 资产升级 园区管理20 积分 | 34 页 | 5.42 MB | 6 月前3
园区ESG及绿色运营白皮书10 积分 | 102 页 | 11.83 MB | 6 月前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100
