化学 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

2025年智能金融：AI+驱动的金融变革报告-浙江大学（郑小林）

QWQ-32B 两阶段强化学习 Gemma-3 多模态推理融合思维链推理 2018年图灵奖、深度机器学习 2024年图灵奖、强化学习浙江大学人工智能教育教学研究中心中心智能教育教学研究中心大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研究中心浙江大学人工智能教育教学研浙江大学人工智能教浙强化学习奠基人获得2024图灵奖强化学习奠基人获得2024图灵奖 3月5日公布了ACM图灵奖获得者 Andrew Barto（MIT教授）和 Richard Sutton（强化学习之父，阿尔伯塔大学教授，DeepMind科学家） ◼ 强化学习的目标是得到一个策略，用于判断在什么状态下选取什么动作才能得到最终奖赏。折扣因子（Discount Factor）浙江大学人工智能教育教学研究中心中心智能教育教学研究中心大学人工智能教育教学研究中心浙 DeepSeek-R1：监督微调+强化学习训练 DeepSeek-R1-Zero （强推理模型）推理导向强化学习（准确率奖励+格式奖励）纯强化学习训练低可控：生成文本可读性差、语言混乱高探索自由度 => 推理能力自我觉醒（更长的思维链、更深层次的推理路径） DeepSeek-V3 （基础模型）监督微调强化学习图源自《ReFT: Reasoning

10 积分 | 45 页 | 7.21 MB | 3 月前
3
电子AI+系列专题：DeepSeek重塑开源大模型生态，AI应用爆发持续推升算力需求

DeepSeekR1/V3 推理服务。 l DeepSeek 通过 MLA 和 DeepSeekMoE 实现高效的推理和低成本训练，构建 DualPipe 算法和混合精度训练优化计算与通信负载；通过 ( 分阶段 ) 强化学习实现性能突破。多头潜在注意力 (MLA) 通过低秩联合压缩技术，大幅削减了注意力键 (keys) 和值 (values) 的存储空间，显著降低了内存需求。 DeepSeekMoE 架构采用了更为精细粒度了训练速度，还大幅降低了 GPU 内存的消耗。 DeepSeek-R1-Zero 通过强化学习架构创新实现突破性性能，核心技术创新体现在训练效能优化策略、双维度评价体系、结构化训练范式三个维度。 DeepSeek-R1 采用分阶段强化学习架构演进，包括冷启动阶段、面向推理的强化学习、拒绝采样与监督式微调、全场景强化学习等。 l AI 应用爆发在即，算力需求持续攀升，关注 ASIC 及服务器产业链。 GPT-4o 等模型的训练成本约为 1 亿美元。 l 2025 年 1 月， DeepSeek-R1 发布，性能对标 OpenAI-o1 正式版。 DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI-o1 正式版。同时 DeepSeek 开源 R1 推理模型，允许所有人在遵循

0 积分 | 38 页 | 1.95 MB | 9 月前
3
中国信通院：普惠算力赋能教育行业研究报告（2025年）

反映了美国对于教育技术的不断探索和适应，自 1996 年首次发布以来，经历了多次更新和演变，以适应不断变化的教育和技术环境。NETP 1996 强调为教育信息化创造基础设施条件；NETP 2000 强调数字化学习的重要性；NETP 2010 强调利用技术促进教育创新。NETP 2024 将教育领域的数字鸿沟划分为“数字使用鸿沟”“数字设计鸿沟”“数字获取鸿沟”，通过对数字鸿沟进行详细的分析、阐好国家教育大数据中心，搭建教育专网和算力共享网络。推进智慧校园建设，探索数字赋能大规模因材施教、创新性教学的有效途径，主动适应学习方式变革。面向数字经济和未来产业发展，加强课程体系改革，优化学科专业设置。打造人工智能教育大模型。建设云端学校普惠算力赋能教育行业研究报告（2025 年） 5 等。部委层面发布文件，从算力行业和教育行业角度出发，部署算力赋能教育行业数字化转型的重点任务。2023 ，K12 教育各方之间的协同关系正在日益紧密。算力技术推动 K12 教育向更高效化发展，数据驱动融合，开启即时教育新天地。AI 作业批改系统借算力集群压缩批改耗时，生成知识漏洞报告；个性化学习模型依学生数据实时生成适配路径。数据驱动融合下，算力将分散数据进行整合，助力教师调整节奏、管理者优化配置。边缘计算的覆盖，让偏远课堂接入虚拟实验室，AI 语音互动系统即时响应学习需求，开启即时教育新生

10 积分 | 52 页 | 1.81 MB | 1 月前
3
电子行业深度报告：DeepSeek推动模型平权，关注AI终端及算力领域

源模型，并在性能上和 GPT-4o 以及 Claude-3.5-Sonnet不分伯仲，训练成本约为558万美元。1月20日， DeepSeek开源R1模型，后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，性能比肩OpenAI o1正式版，不仅极大提升了模型推理能力，也大幅降低了训练成本。同时，DeepSeek-R1蒸馏了6个小模型，其中32B和70B模型在多项能力上实现对标OpenAI 等开源模型，并在性能上和 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲，训练成本仅约为 558 万美元。1 月 20 日，DeepSeek 开源 R1 模型，后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩 OpenAI o1 正式版。图 1：DeepSeek R1 性能比肩 OpenAI

0 积分 | 23 页 | 2.65 MB | 9 月前
3
金融行业银行客户经理基于DeepSeek构建AI Agent智能体应用方案（237页 WORD）

40%的人力成本节约，同时将客户满意度 (NPS)提升 15 个百分点。项目将分三阶段推进：三个月内完成基础问答能力部署，六个月内实现复杂业务处理，十二个月内达成全业务场景覆盖。通过持续迭代的强化学习机制，确保智能体每月更新业务知识库，保持对监管政策变化的即时响应能力。 2. 智能体功能设计智能体功能设计围绕银行客户经理的核心工作场景展开，通过 DeepSeek 大模型的多模态交互、知识库整合及实时决策能力，构 300+规则模型）、事后审计分析（保留完整操作日志）。对疑似欺诈行为自动触发二级验证流程，误报率需控制在 3%以下。培训模拟模块包含虚拟沙箱环境，可模拟 200+种客户沟通场景，智能体通过强化学习持续优化话术策略。每月更新培训案例库，确保应对市场变化的时效性。测试数据显示，经过 6 个月迭代的智能体在客户满意度评分上比初期版本提升 41%。 2.1 客户咨询与应答客户咨询与应核心推荐逻辑采用三级筛选机制： 1. 合规性过滤：通过内置的金融产品合规知识库（含监管政策、适当性管理办法等）排除不匹配产品，确保推荐符合《商业银行代理销售管理办法》要求 2. 需求匹配：运用深度强化学习算法计算产品特征与客户画像的匹配度，关键指标包括： o 风险等级匹配度（R 值）≥0.85 o 收益预期偏差率 ≤15% o 流动性需求吻合度 >90% 3. 个性化排序：结合客户历史选择偏好（如产品类型点击率、购

10 积分 | 247 页 | 2.05 MB | 3 月前
3
电子行业深度报告：AI系列深度，AI+降本增效拓宽应用，硬件端落地场景丰富-20230712-东吴证券-28页

升级至四代，模型能力高速提升。ChatGPT 是由 OpenAI 开发的自然语言生成模型，采用 Transformer 神经网络架构（又称 GPT-3.5 架构），基于大量的语料库使用指示学习和人工反馈的强化学习（RLHF）来指导模型训练。模型可理解并生成对各种主题的类似人类的响应，是 AIGC 技术进展的成果。2023 年 3 月 15 日，OpenAI 正式官宣了多模态大模型 GPT-4，ChatGPT4 请务必阅读正文之后的免责声明部分东吴证券研究所行业深度报告 16 / 28 程序，将在未来几周扩展至其他国家。该 APP 可向用户提供定制化建议、激发创作灵感，或者让用户实现个性化学习。此外，Open AI 还表示将很快推出 Android 版 ChatGPT 应用。 2023 年 5 月 11 日，谷歌在 I/O 大会上发布 Android14，首次引入魔法撰写（Magic

0 积分 | 28 页 | 2.68 MB | 9 月前
3
全球重点区域算力竞争态势分析报告（2025年）-中国通信工业协会数据中心委员会

• 采用风能和太阳能发电，并通过绿电交易实现园区零碳或近零碳运营。2025年实施的200MW风电+储能项目，年发电量约5亿千瓦时，减少碳排放近40万吨。 • 建设源网荷储一体化项目，通过电化学储能系统调节风电波动，减少对电网的压力。 81 资料来源：公开信息以世纪互联乌兰察布云智算中心基地为例，项目位于乌兰察布市察哈尔高新技术开发区，总规划算力可超万P，以技术突破实现算力与绿色能源的协同。一是自主研发算在一定程度上塑造了全球AI技术的发展范式，中国的本土框架面临着从技术突破到社区运营的系统性挑战。中美人工智能技术差距来源于多方面因素。国内人工智能产业起步晚，基础研究与产业生态发展滞后。技术研究长期重应用、轻基础，在物理、化学、材料学等底层科学上积累不足，导致原创性技术突破乏力，也忽视了核心技术的自主研发。高端复合型人才不足，缺乏具备理论和规模应用经验的顶尖领军人才和高级工程师团队。产业生态不企业芯片型号制程工艺发展侧重点不同。例如，AI Agent正成为美国企业提升效率的关键工具，而中国ToB端AIGC产品主要在财务、人力、营销等业务场景落地；教育领域，中国更注重模型的应试导向，美国则强调个性化学习；广告营销、视频生成等细分场景也存在结构性分化。2025年，中国开源模型的全球影响力扩张取得重要进展，新加坡国家人工智能计划（AISG）正在进行一次重大战略调整，在其最新的东南亚语言大模型

10 积分 | 114 页 | 8.80 MB | 1 月前
3
金融与AI融合持续深化【AI金融新纪元】系列报告（四）-东吴证券

会。东方财富可通过妙想大模型支持多语种投研服务，同花顺则布局港股、美股智能交易助手。 AI 投教与认证体系。开发互动式投教课程（如模拟交易实训、 AI 陪练），并结合大模型生成个性化学习路径。例如，九方智投的智能投教课程已形成差异化竞争力，同花顺可进一步整合问答社区与 AI 导师功能。数据资产化与 API 经济。将 AI 处理后的结构化数据（如行业产业链图谱、舆情风险评分）封装为标准化

10 积分 | 38 页 | 1.08 MB | 3 月前
3
工业园区国际指南本地化指标体系对比研究报告

产业共生、清洁生产、基础设施共享、环境管理等多方面形成了工业园区绿色可持续发展的中国方案，并取得了较为显著的成效。以国家级经济技术开发区为例，在土地占地面积、水资源消耗量、综合能源消耗量、化学需氧量和二氧化硫排放量分别仅占全国 0.15％、1.9％、2.2％、0.8％和 0.6％的情况下，创造了全国 8.7％的地区生产总值和 15.6％的工业增加值。 2 赵若楠，马中中国工业园区绿色发展政策对比分析及对策研究能够扫描监测多条光路中上百种有毒害、易燃易爆物质； ▪ 红外监测光程最低检测限可达到 PPb（十亿分之一）级； ▪ 24 小时全自动、多方位、多光径自动扫描； ▪ 可灵活设定污染物浓度警告限值，及时反映化学因子的超标现象并预警，避免发生灾难性事故； ▪ 配套溯源预警软件、移动监测和测量设备，可及时溯源并分析废气的成分和扩散规律，以及对周边地区的大气环境的影响。应用领域：这项固定和移动相结合的空气质量分类指标名称单位资源综合利用指标一般工业固体废物综合利用量万吨 * 一般工业固体废物综合利用率％ * 规模以上工业企业重复用水率％废物排放指标 * 二氧化硫排放量万吨 * 化学需氧量排放量万吨 * 氨氮排放量万吨 * 氨氮化物排放量万吨 * 单位地区生产总值 CO2 排放量吨 / 万元工业固体废物处置量万吨工业废水排放量万吨其他指标 * 非化石能源占一次能源消费比重

10 积分 | 195 页 | 9.44 MB | 3 月前
3
汽车行业数字化转型服务商发展报告（2025）-88页

DCMS 经销商渠道竞争力管理系统整合主机厂对经销商管理的全景运营数据，构建对经销商的评价模型，形成对经销商的分级管理和数字化运营管理。 20 DTS 经销商培训赋能管理系统覆盖多样化学习形式的在线人员管理及培训系统，实现线上化人员管理、培训、考试等面向人员赋能的相关功能。表2-5 服务环节服务产品及工具细分领域序号缩写名称产品功能售后维修 1 / 售后质量管理系统本次所调研的生产数字化服务商中，冲压和涂装服务商相对较少，涂装和总装服务商相对较多。这是由于冲压和涂装的技术壁垒极高，冲压的核心是模具开发，涉及复杂的材料学和工艺诀窍，涂装需控制数千个化学参数，这就决定了这两大环节投资巨大（单条产线达数十亿元），且与核心质量强绑定，只有掌控核心技术、具有雄厚资金实力和产业基础的服务商才会涉足这两大环节。相比之下，焊装和总装更侧重于自动化集成与流程管理、技术更易标准

10 积分 | 88 页 | 5.64 MB | 1 月前
3

共 19 条前往

页

分类

语言

格式