北大:DeepSeek-R1及类强推理模型开发解读DeepSeek-R1 \ Kimi 1.5 及 类强推理模型开发解读 陈博远 北京大学 2022 级“通班” 主要研究方向:大语言模型对齐与可扩展监督 https://cby-pku.github.io/ https://pair-lab.com/ 北大对齐小组 DeepSeek-R1 开创 RL 加持下强推理慢思考范式新边界 DeepSeek-R1 Zero 及 R1 技术剖析 推理范式的涌现 DeepSeek-R1 社会及经济效益 技术对比探讨 STaR-based Methods vs. RL-based Methods 强推理路径对比 (DS-R1 \ Kimi-1.5 \ o- series) 蒸馏 vs. 强化学习驱动:国内外现有各家技术路线对比分析及 Takeaways PRM & MCTS 的作用 从文本模态到多模态 其他讨论: Over-Thinking 27 K1.5 专注于用长文本 CoT 解决推理时 Scaling 问题 利用 RL 探索: Kimi k1.5 的核心思想是利用强化学习,让模型通过试错(探索)来学习解决问题 的能 力,而不是仅仅依赖于静态数据集。 长文本 CoT 的 RL :将 RL 应用于长文本10 积分 | 76 页 | 6.72 MB | 5 月前3
5G +AI投资策略研究报告射频端:需求增加、技术升级、集成度提升 1.2 摄像头:5G智能化时代最核心传感器,持续升级 1.3 面板:柔性OLED趋势不改,大尺寸LCD静待行业价格拐点 1.4 设备和材料:国产替代加速进行 1.5 AI:安防、汽车和IoT将是率先爆发的三个场景 2 安防行业:需求逐渐回暖、AI加速、海外拓展 2.1 智能汽车:5G+AI促进无人驾驶加速落地 2.2 IoT:技术逐渐突破,巨头加速布局 1.2 射频端:需求增加、技术升级、集成度提升 1.3 摄像头:5G智能化时代最核心传感器,持续升级 1.4 面板:柔性OLED趋势不改,大尺寸LCD静待行业价格拐点 1.5 设备和材料:国产替代加速进行 7 从4G换机周期看5G:国内4G换机周期效应明显 -60% -40% -20% 0% 20% 40% 60% 80% 0% 10% 20% 1.2 射频端:需求增加、技术升级、集成度提升 1.3 摄像头:5G智能化时代最核心传感器,持续升级 1.4 面板:柔性OLED趋势不改,大尺寸LCD静待行业价格拐点 1.5 设备和材料:国产替代加速进行 12 5G对终端射频器件影响:需求增加、技术升级、集成度提升 新频段 • 滤波器需求倍增 • 频谱重新划分增加射频前端复杂性 高频率 • BAW将成为滤波器主流10 积分 | 206 页 | 10.47 MB | 5 月前3
北京大学-DeepSeek原理和落地应用2025支持系统等需要深度推理的任务,也能 拿来当教育工具,帮学生锻炼逻辑思维 常见推理模型 DeepSeek R1 OpenAI o1 OpenAI o3-mini Gemini 2.0 Grok3 Kimi 1.5 18 为什么火:能力突破、开源、低成本、国产化 DeepSeek以“推理能力+第一梯队性能” 为核心基础,叠加:开源开放、超低成本、 国产自主研发三大优势,不仅实现技术代际 跨越,更推动AI技术普惠化与国产化生态繁 • vLLM部署:生产、开发、垂直领域私有化部署,精度可控,更专业 • 其它 Model Base Model 特点 DeepSeek-R1-Distill-Qwen-1.5B Qwen2.5-Math-1.5B 蒸馏模型,能力稍弱 实际上是增加了推理能力的Qwen模型和Llama模型 DeepSeek-R1-Distill-Qwen-7B Qwen2.5-Math-7B De10 积分 | 57 页 | 9.65 MB | 5 月前3
2025食品饮料行业AI转型白皮书-甲子光年-82页Danube21 8B Phi-2 3B Phi-1.5 Gernma2 2.6B Llama3.2 3B Phi-3.5 3.8B Llama3.1 8B Mistral 7B Mixtral 47B A13B Qwen2 57B A14B Gemma2 27B Llama3.1 70B Jamba1.5 52B A12B Rene Cartesia 1.3B10 积分 | 82 页 | 17.71 MB | 5 月前3
华泰证券:DeepSeek冲击下,AI产业对国内电力行业的变与不变海光信息 寒武纪 天数智芯 FP16算力功耗比 INT8算力功耗比 (TFLOPS/W) 英伟达H100和AMD MI300X受美国芯片 禁令影响 国产芯片 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0 5 10 15 20 25 DGX A100 DGX H100 DGX H200 DGX B100 DGX B200 MI210 MI300 X 30%-50%。此外,由于巴拿马电源精简了中间环节,因此设备使用量亦相应减少,以 ODCC《巴拿马技术白皮书》案例来看,降本主要来自于线缆等配套设备的成本,投资成 本大大降低。 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 6kW机柜 12kW机柜 30kW机柜 万平方米 机房面积 配电房面积 2.1 2.7 3.4 23.0 17.6 14.2 中恒电气 002364 CH NA NA NA NA NA NA 特变电工 600089 CH 1.1 1.5 1.9 11.4 8.5 6.6 保变电气 600550 CH NA NA NA NA NA NA 伊戈尔 002922 CH 1.0 1.3 1.7 180 积分 | 25 页 | 1.36 MB | 5 月前3
中国算力中心行业白皮书MinMax- VL-01 4560亿 DeepSeek-R1- Distill- Qwen-32B 320亿 Phi-4 140亿 DeepSeek-R1- Distill- Qwen-1.5B 15亿 2025年1月 2025年1月 2025年1月 2025年1月 2025年1月 18 资料来源:灼识咨询 ➢ 大模型算力选择应着重最优解而非最大解:不同需求程度的模型不能唯算力的 上不得新建各类大型及超大型数据中心,坚决避免区域间 盲目无序竞争。 ➢ 到 2025 年底,新建及改扩建大型和超大型数据中心电能 利用效率降至1.25以内,国家枢纽节点数据中心项目电能 利用效率不得高于1.2,平均电能利用效率降至1.5以下, 可再生能源利用率年均增长10%。 ➢ 到 2030 年底,全国数据中心平均电能利用效率、单位算 力能效和碳效达到国际先进水平,北方采暖地区新建大型 及以上数据中心余热利用率明显提升。 ➢ 43 资料来源:专家访谈,灼识咨询 2025-2028 年粤港澳地区累计新增需求 0.6GW,累计新增供给 1.2GW 2025-2028 年西南及其他地区累计新增需求 1.0GW,累计新增供给 1.5GW 单位:MW 2025-2028 年前三大需求分布 2025-2028 年前五大供给分布 2025-2028 年累计需求分布(地区占比、累计需求) 2025-2028 年累计供给分布(地区占比、累计供给)10 积分 | 54 页 | 6.96 MB | 5 月前3
2025年DeepSeek手册:DeepSeek给我们带来的创业机会四个全球领先 世界的360 • 实战能力第一,实战是检验安全企业能力的唯一标准 • 安全研发投入第一,相当于第2名到第10名的总和 • 服务器和算力投入安全行业第一 • 创新能力第一,专利申请1.5万件,安全行业最多 • 服务和响应能力第一 • 用户数量第一,覆盖225个国家和地区的15亿终端 • 企业客户规模第一的网安公司 • A股网安公司市值第一 安全能力最强,八个中国第一 中国的360 人 云端数据汇聚 • 探针数据上传到云 端 • 20万台服务器 • 210个数据中心 • 4000G出口带宽 • 1000P算力规模 大数据分析 • 总规模2.2EB,每天新 增1.5PB • 测绘数据300亿条 • 90亿+域名信息 • 存活网址库总量50000 亿条,每日新增13亿 人工智能分析 • 独创安全大数据AI智 能分析技术 • 荣获十次国际冠军/提 名人工智能奖项10 积分 | 76 页 | 5.02 MB | 5 月前3
2025年人形机器人应用场景洞察白皮书-工业场景篇发 布 基 础 能 力 工 作 能 力 量 产 交 付 2018年 正式发布第一代人形机器人Walker:实现了中国双足 机器人行走能力的突破,该机器人拥有 14 个自由度, 行走速度达 1.5km/h,具备了上下楼梯、踢球、舞蹈、 感知避障、人机交互等功能 2019年 发布第二代Walker:增加了灵活的双臂和灵巧的双手, 结合机器视觉能力,可实现手眼协调抓取,引入语音 交互,可识别周围环境和地形,实现自主导航行走 2025 头部企业小批量测试 2027 标杆企业商业化尝试 搬 运 质 检 工 站 衔 接 基 础 组 装 当前适配工种 未来适配工种… 0.0 1.0 2.0 0.5 1.5 2.5 3.0 Mn RMB Y0 Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 2025E全生命周期机器人总成本 2030E全生命周期机器人总成本 全生命周期人工总成本(美国为例)10 积分 | 33 页 | 2.38 MB | 5 月前3
智能机器人行业产业研究报告2025-20250318-极光大数据2024-01 2024-03 2024-05 2024-07 2024-09 2024-11 2025-01 2023年-2025年智能AI应用MAU数据 1 技能劳动者的求人倍率超过1.5,高级 技工的求人倍率甚至达到2以上,蓝领 高级技工的缺口达到了上千万人。 劳动力缺口大 2 蓝领群体的平均年龄也在继续增加,40 岁以上蓝领劳动者占比约50%,年轻群 体进入蓝领工作岗位的意愿较低。 业机器人的数据来看,近两年 专业服务机器人的年安装量以约30%的增长率增长,制造商数量位居第二,但相较于第一的下降之势中国商业机器人制造商数量正在逐步攀升。 资料与数据来源:IFR -2 -1.5 -1 -0.5 0 0.5 0 10 20 30 40 50 60 2020 2021 2022 2023 中国 日本 美国 韩国 德国 其他 总量 增长率 历年全球工业机器人年安装量(单位:万台)0 积分 | 24 页 | 3.34 MB | 5 月前3
算力基础设施高质量发展行动计划(三)主要目标 到 2025 年,计算力方面,算力规模超过 300 EFLOPS,智 能算力占比达到 35%,东西部算力平衡协调发展。 运载力方面,国家枢纽节点数据中心集群间基本实现不高 于理论时延 1.5 倍的直连网络传输,重点应用场所光传送网 (OTN)覆盖率达到 80%,骨干网、城域网全面支持 IPv6,SRv6 3 等创新技术使用占比达到 40%。 存储力方面,存储总量超过 1800EB,先进存储容量占比达0 积分 | 18 页 | 309.59 KB | 20 天前3
共 15 条
- 1
- 2
