pdf10 积分 | 11 页 | 422.61 KB | 1 天前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告以需要寻找额外的 Scaling Laws [1]。 [1] Training Verifiers to Solve Math Word Problems https://arxiv.org/pdf/2110.14168 [2] Scaling LLM Test-Time Compute Optimally can be More Effective than Scaling Model Parameters 天然 契合;此外,GRPO直接将策略模型与参考模型的KL散度作为正则项加入损失函数,而非将其混入 奖励计算,简化了优势值的计算。 DeepSeekMath https://arxiv.org/pdf/2402.03300 24 DeepSeek-R1 技术剖析:GRPO 赋能RL-Scale ➢From PPO to GRPO: ➢ 基于结果监督的GRPO: 对于每个问题q,从旧策略模型𝜋𝜃𝑜𝑙𝑑采样一组输出 其中𝑖𝑛𝑑𝑒𝑥 𝑗 是第 𝑗步的末 尾词元索引, 𝐾𝑖是第 𝑖 个输出的总步数。归一化后,优势值为后续步骤归一化奖励的累加和 DeepSeekMath https://arxiv.org/pdf/2402.03300 基于结果监督的GRPO优势值估计 基于过程监督的GRPO优势值估计 25 DeepSeek-R1 Takeaways 总结 Part II ➢ DS-R1 Zero10 积分 | 76 页 | 8.39 MB | 5 月前3
ABeam:智变中国-2025科技趋势洞察报告AI 1 AI 2 AI AI AI [1]. 2025-2025-01-02.pdf 2024-12 19 3.1 + [1] [1] ◼ ◼ ◼ ◼ [1]. 2023-10-20 [2]. 2025-2025-01-02.pdf 2024-12, ABeam Consulting 20 3.2 TO B TO C Lv1-Lv5 2024-06-04 [2]. https://www.caict.ac.cn/english/research/whitepapers/202311/P020231103487266783845.pdf 2023-09 AI AI AI AI AI ◼ AI AI Epoch AI 2028 2032 [1] Synthetic20 积分 | 97 页 | 11.51 MB | 1 天前3
AI跃迁派:2025年DeepSeek零基础完全指南提供网页版、APP、微信小程序、电脑版四大入口,满足不同场景需求: ①网页版(零门槛即用) 访问方式:浏览器输入`https://chat.deepseek.com` 特点: ⚫ 无需下载,支持文件上传(PDF/Word/图片) ⚫ 功能齐全,包含普通模式(V3)、深度思考(R1)、联网搜索 操作提示:登录后点击输入框下方按钮切换功能模式,例如开启 R1 模式处理复杂数学 题 ②手机 安全提示:建议设置“字母+数字+符号”组合密码,定期更换 ②核心功能切换 ③文件交互技巧 支持格式:PDF(需文字可复制)、Word、Excel、图片(JPG/PNG) 高阶用法: ⚫ 文档对比:上传 A/B 两份文件,输入“分析市场策略差异” ⚫ 数据提取:从实验报告 PDF 中自动整理温度数据表格 避坑指南:超过 50 页的长文档建议拆分处理,避免解析超时 3.常见问题速查10 积分 | 21 页 | 1.01 MB | 5 月前3
审计领域接入DeepSeek AI大模型构建Agent智能体提效设计方案(204页 WORD)模型,审计智能体需要具备三个核心能力维 度:首先是领域知识的深度适配,包括国际财务报告准则 (IFRS)、美国通用会计准则(GAAP)等超过 2000 项条款的准 确解析;其次是多模态数据处理能力,既能解析 PDF 财报和扫描 凭证,又能处理 Excel 底稿和数据库日志;最后是可追溯的推理链 条,每个审计结论都必须具备可验证的逻辑路径。以下为审计智能 体与传统工具的对比差异: 能力维度 传统审计软件 政策时效性方面的可靠性,例如能够准确识别 2022 年财政部新修 订的收入确认准则(财会〔2022〕25 号)的具体变化条款。 在审计工作流中的技术适配性主要体现在三个维度:首先,非 结构化数据处理能力可解析 PDF 版银行对账单、扫描件合同等传 统 OCR 难以处理的文件,实测显示对模糊文档的字段提取准确率 达到 92%,较传统技术提升 40%;其次,风险预测模块通过分析 历史审计案例库,可自动生成高风险科目预警清单,在试点项目中 DeepSeek 智能体与审计业务系统对 接的核心环节,需实现多源异构数据的标准化处理。该模块通过 API 接口、数据库直连、文件解析三种方式采集数据,覆盖财务系 统(如 SAP、Oracle)、电子凭证(PDF/扫描件)、业务数据库 (MySQL/SQL Server)以及外部数据源(工商信息、税务数 据)。针对审计场景的特殊性,数据采集需遵循完整性、时效性、 可追溯性原则,例如凭证类数据需保留原始哈希值以供校验,时序10 积分 | 212 页 | 1.52 MB | 1 天前3
AI智能体行业案例(22页 PPT)3 )限制,包括要求拒绝回答无关问题并要求按格式回复。对于专业领域问答,一般还需要规定明确的回复格式,这可以 通过少样本提示完成。我们使用的民法典原文件是 PDF 格式,将在扣子中被转换成文本格式(大模型无法直接处理 Word 和 PDF 等格式的文档,需要转换成纯文本格式)在智能体配置的“知识”中选择“文本”,添加已有的知识库,在创建 知识库时,用户可以上传文档,并设置文档解析策略、过滤策略和10 积分 | 22 页 | 1.02 MB | 1 天前3
2025面向工程审计行业的DeepSeek大模型应用指南-南京审计大学工程审计学院(45页 WORD)上传附件 ”按钮。在上传附件时,确保数据隐私不被泄露。 点击 “ ” 上传附件 按钮,从本地文件系统选择要上传的文件。DeepSeek 支 持的文件格式依功能和设置而定,常见的有 txt、pdf、docx 等文本类文件。工 程 审计场景中,可上传工程预算书、结算报告、合同文件等。 图 3-5 上传附件界面 上传前,务必评估文件有无敏感隐私数据。若包含个人身份信息(如身份证 实现 新项目的招投标文件编制。以投标文件编制为例,在对 “ 话框中输入类似 根据《xx ” 工程招标公告》的要求,编制该工程的投标文件 等提示词以及项目招标文件中 提供的工程设计图纸(PDF 或图片格式),DeepSeek 会基于本地知识库中已有 的 投标文件范本、相关的工程量计量规范及计价规范、施工规范、验收规范、 35 费用 35 定额、施工定额等,给出初步的投标文件,含施工方案、平面布置图以及进度 可自动匹配系统中类似项目的工程量汇总表,如 差异较大 将给出提示,以确保工程量计算准确。 5.5.2 智慧计算工程量 在本地化部署的系统中已经加载了工程量测算的知识,可以利用该知识来 实 现智慧工程量测算。在上传当前工程图纸(PDF 或图片格式)后,在对话框 中输 “ ” 入类似 请根据图纸分析计算工程量 等提示词。模型会基于本地知识库中 38 已有 的类似项目数据、计算规范等给出初步的工程量测算结果。如 图 5-910 积分 | 59 页 | 1.06 MB | 1 天前3
英特尔-教育行业AI实战手册2024Object Detection,Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi https://arxiv.org/pdf/1506.02640.pdf 行为分类:在区分出待检测的各个学生后,就需要对学生当 前行为进行识别与分类。通常而言,最简单的行为识别就是 以单一视频帧为对象,然后利用 CNN 对其进行识别,但这种 方法 Hausknecht,Sudheendra Vijayanarasimhan, Oriol Vinyals,Rajat Monga,George Toderici https://arxiv.org/pdf/1503.08909.pdf 视频采集 人物检测 行为分类 图 2-2-2 面向教育场景的行为分析方案架构 图 2-2-4 采用 LSTM 模型的行为识别网络架构 图 2-2-5 按帧统计时的行为状态分析 HCLG,Kaldi 中使用 compile-train-graph 来加载声学模型, 用 faster-decoder 解码器进行维特比解码,解码器的输出结 果会包含识别文本序列、pdf-id 序列。其中,pdf-id 序列可以 计算出音素的起始帧和帧数,根据音素的时间轴信息可以还原 识别文本的单词、句子的时间轴信息。根据这些时间轴信息在 声学模型中提取分数特征用来结算每个颗粒度的发音分数。10 积分 | 40 页 | 4.85 MB | 5 月前3
DeepSeek大模型及其企业应用实践广泛的应用形态。基于知识库数据源 和API查询,对话助手能够实时回答 用户问题,提供高效的信息传递。例 如,某一乘用车通过搭建基于AI大模 型的汽车在线问答平台,实现了对非 结构化文档(如PDF、Word等)的 智能知识交互,提升了员工工作效率 和学习能力。该平台提供7*24小时的 智能知识服务,问题交互准确率达 95%以上,客户满意度提升了35% 对话助手 企业常常需要撰写大量报告,这些报 Deep Research。Deep Research由OpenAI o3模 型的一个版本提供支持,该模型针对网页浏览和数据分析进行了优化,它利用推理来搜索、解释和分析互联网上 的大量文本、图像和PDF,并根据需要根据遇到的信息做出调整。Deep Research具有以下四大核心技术: 会自动24小时扫描全球知识库 数据雷达 能把零散的信息拼成完整的战略地图 知识拼图 发现矛盾时,自动回溯、验证,调整推理路径 帮你发现文档中的错误 DeepSeek的“魔法”指令 8.2 文本类AIGC应用实践 n 使用DeepSeek处理文档 点击DeepSeek界面中的「回形针」图标上传文件,支持的文件类型包括文本类(PDF、DOCX、TX T、 Markdown)、数据类(CSV、XLSX)和图像类(JPG、PNG)。然后,就可以在对话框中输入提示词,比如, 可以输入“总结这份年报的三个核⼼要点”、“提取合同中的责任10 积分 | 147 页 | 16.82 MB | 5 月前3
金融银行业务接入DeepSeek AI大模型智能体建设方案(304页 WORD)识别准确率≥99.5%(300dpi 标准分辨率) o 表格结构还原 F1-score 达98.2% o 跨模态语义关联响应时间<800ms(A4 尺寸文档) 2. 动态文档理解 支持 PDF、Word、Excel 等20+文件格式的端到端处理,具 备以下特征: o 自动识别文档中的关键字段(如金额、账号、日期) o 理解多页文档的全局逻辑关系 o 保留原始排版格式的语义标注 5% ≥ 部署阶段采用动态热更新机制,通过以下方式保证模型持续优 化: 1. 建立客户反馈自动标注流水线,将人工坐席修正记录转化 为训练样本 2. 每周增量训练时引入最新监管政策文档(PDF/PPT 格式自动解析) 3. 季度性全量微调时同步更新金融知识图谱(含 约20 万实体关系对) 该模块通过金融专用 tokenizer 扩展( 新增 1,200+金融词汇) 和注意 处理(四分位数范围缩 放),避免极端值影响 o 文本字段:执行 GB18030 编码统一转换,处理特殊字 符集问题 非结构化数据处理 建立多模态处理流水线,重点解决文档类 数据的标准化: 1. PDF/ 扫描件处理: - 使用 OCR 引擎提取文本 后,通过正则表达式过滤非金融相关符号 - 关键字段(如金额、 日期)提取模板: 字段类型 正则表达式 后处理逻辑 人民币金额 ¥10 积分 | 313 页 | 3.03 MB | 1 天前3
共 37 条
- 1
- 2
- 3
- 4
