电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力, 其在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式 版。并且,DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借 助 R1 训练其他模型,进一步促进技术的开源和共享,用户可通过官 网或 App 调用 DeepSeek-R1 完成各类推理任务。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens0 积分 | 4 页 | 269.47 KB | 6 月前3
电子行业深度报告:DeepSeek推动模型平权,关注AI终端及算力领域Llama-3.1-405B 等 开 源 模 型 , 并 在 性 能 上 和 GPT-4o 以 及 Claude-3.5-Sonnet不分伯仲,训练成本约为558万美元。1月20日, DeepSeek开源R1模型,后训练阶段大规模使用了强化学习技术,在仅有 极少标注数据的情况下,性能比肩OpenAI o1正式版,不仅极大提升了 模型推理能力,也大幅降低了训练成本。同时,DeepSeek-R1蒸馏了6个 快速发展也将反哺训练算力、推理算力需求。 AI终端有望加速落地。AI手机:苹果国行AI功能渐行渐近,三星国行S25 系列搭载智谱Agentic GLM,而华为、荣耀、OPPO等多家国产终端近期 亦官宣接入R1模型。群智咨询预计今年全球智能手机出货量同增4%。其 中我国出货量同增4.9%,增速好于全球市场,除了受AI加持外,国补政 策落地也将促进用户换机。AI耳机:字节、Cleer、讯飞等多家品牌密 集发布智能耳机产品。字节推出Ola 算力需求仍将加大。近期微软、亚马逊、谷歌、Meta披露最新业绩,四 大科技巨头Q4资本开支合计同比大幅增长77%,主要支持云计算、AI等 基础设施建设。同时后续资本开支指引积极,海外CSP并未因DeepSeek V3 及R1模型推出而放缓资本开支投入的步伐,反而加大相关投入,而国内 CSP为了保持竞争优势亦有望跟进,增加AI领域相关投入。同时AI应用 场景加速普及,也将反哺算力需求。 风险提示:终端需求不及预期;技术推进不及预期;资本开支投入不及0 积分 | 23 页 | 2.65 MB | 6 月前3
2025年智能金融:AI+驱动的金融变革报告-浙江大学(郑小林)对V3模型 监督微调 推理导向强化学习 (准确率奖励+可读性奖励) R1-Zero生成的 长思维链数据 60万条 推理数据 20万条 通用数据 多阶段增强训练 拒绝采样:筛选高质量样本 R1蒸馏版 1.5B~32B 浙江大学人工智能教育教学研究中心 中心 智能教育教学研究中心 大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研 浙江大学人工智能教育教学研究中心 浙江大学人工智能教育教学研 浙江大学人工智能教 浙 根据Vectara的测试,R1的幻觉率14.3%,显著高于其前身V3的 3.9%。这跟它加强了的“思维链”(CoT)和创造力直接相关。 OpenAI:推理增强会明显减少幻觉! DeepSeek R1 实测:推理增强后幻觉率增加! 过度延展的推理机制 解决方案? 提升训练 数据质量 (标注、 过滤噪 声)10 积分 | 45 页 | 7.21 MB | 4 小时前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求少标注数据的情况下, 极大提 升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1 正式版。同时 DeepSeek 开源 R1 推理模型,允许所有人在遵循 MIT License 的情况 下,蒸馏 R1 训练其他模型。 2023/05 2023/11 2024/02 2024/03 2024/05 2024/06 2024/09 标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI-o1 正式版。 l DeepSeek-R1 遵循 MIT License ,允许用户通过蒸馏技术借助 R1 训练其他模型;同时上线 API ,对用户开放思维链输出; DeepSeek 官网与 App 同步更新上线, 用户打 开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。 其 计 价 相 同 。 请务必阅读正文之后的免责声明及其项下所有内容 采用硬盘缓存技术大幅降低延迟和成本 图:数据分析场景,后续具有相同前缀的请求会 命中上下文缓存 DeepSeek -R1 16 元 32K 64K 4 元 1 元 8K 图: DeepSeek-R1 等模型输入输出价格对比 百万 tokens 百万 tokens 输 入 价 格 输 入 价0 积分 | 38 页 | 1.95 MB | 6 月前3
电子行业深度报告:AI系列深度,AI+降本增效拓宽应用,硬件端落地场景丰富-20230712-东吴证券-28页........................................................................... 10 图 12: 内设苹果 M2 芯片以及 R1 全新芯片 .................................................................................... 10 图 13: 降本增效拓展应用场景,有望提升设备渗透率 2.1.1. 终端设备品牌厂商大力推动应用场景拓展 苹果如期发布首款 MR 头显 Apple Vision Pro,硬件层面规格拉满,M2 计算+R1 传 感双芯片,搭载单眼 4k 分辨率硅基 OLED+3p pancake 显示方案,同时通过 12 摄像头 +5 传感器+6 麦克风、沉浸式声学系统、双向透视、虹膜识别、瞳距调节等,仅依赖于 Pro 聚焦游戏、工作、交流,在工业、医 疗、设计等多领域,有望成为增强生产力的工具,也意味着正式进入空间计算时代。 图11:Vision Pro 实物图 图12:内设苹果 M2 芯片以及 R1 全新芯片 数据来源:纽约时报,东吴证券研究所 数据来源:纽约时报,东吴证券研究所 Vision OS 提供了多项应用场景: ⚫ 高效办公,打破远程办公地域限制。Vision0 积分 | 28 页 | 2.68 MB | 6 月前3
金融行业银行客户经理基于DeepSeek构建AI Agent智能体应用方案(237页 WORD)产品对比功能通过智能参数矩阵实现可视化呈现: 对比维度 产品 A(货币基金) 产品 B(结构性存款) 产品 C(债券理财) 年化收益率 2.3%-3.1% 1.8%-3.5% 3.2%-4.0% 风险等级 R1 R2 R3 起购金额 1 元 5 万元 10 万元 流动性特征 T+0 赎回 到期自动转存 封闭期 90 天 实时推荐优化机制包含: 动态反馈学习:每次推荐后记录客户停留时长、最终选择等数 o 敏感行业转账(如虚拟货币、跨境赌博) 3. 智能决策矩阵 基于风险等级(R1-R5)和业务类型生成处置方 案,决策响应时间控制在 800ms 内: 风险等级 贷款审批 理财推荐 账户操作 R1 自动通过 全品类 无限制 R3 人工复核 限低风险 单日限额 R5 自动拒绝 禁止交易 冻结账户 风险处置流程采用闭环管理: 合规审计方面,智能体实现: 全流程操作留痕,支持监管要求的 信用历史(征信评分、逾期记录时间线) 行业风险参数(所属行业景气指数、政策敏感度) 采用三层评估模型进行动态计算: 风险等级划分为五档并对应处置策略: 风险等级 分值区间 特征描述 自动触发措施 R1 0-20 低风险优质客户 提升授信额度 5% R2 21-40 一般风险常规客户 维持现有风控策略 R3 41-60 关注级客户 季度审查频率加倍 R4 61-80 高风险客户 冻结非柜面交易10 积分 | 247 页 | 2.05 MB | 4 小时前3
共 6 条
- 1
