word文档 面向审计行业DeepSeek 大模型操作指南(27页 WORD) VIP文档

829.29 KB 27 页 0 下载 3 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.docx
3
概览
面向审计行业 DeepSeek 大模型操作指南 版本 1.0 | 适用对象:审计从业人员 南京审计大学 计算机学院大模型团队提供 2025 年 2 月 8 日 目录 1 DeepSeek 基本概况................................................................................................................3 2. DeepSeek 主要版本...............................................................................................................4 3. DeepSeek 审计能力...............................................................................................................5 4. DeepSeek 部署方法...............................................................................................................6 4.1 官方渠道..................................................................................................................6 4.1.1 网页版使用......................................................................................................6 4.1.2 手机版使用......................................................................................................8 4.2 第三方渠道..............................................................................................................8 4.2.1 硅基流动&华为云 ...........................................................................................8 4.2.2 纳米 AI 搜索.....................................................................................................9 4.2.3 阿里云 ...........................................................................................................10 4.2.4 百度智能云.....................................................................................................11 4.2.5 火山引擎........................................................................................................11 4.2.6 其他平台........................................................................................................12 4.3 本地部署................................................................................................................12 4.3.1 下载 ollama ........................................................................................................... 13 4.3.2 合适版本安装..................................................................................................13 4.3.3 输入安装代码 ................................................................................................15 4.3.4 测试部署模型 ................................................................................................17 4.3.5 部署非量化模型.............................................................................................18 5. DeepSeek 审计助手.............................................................................................................20 5.1 基础操作场景........................................................................................................20 5.2 审计工作辅助.......................................................................................................21 5.3 审计学习考试.......................................................................................................22 5.4 其他提示...............................................................................................................23 1. DeepSeek 基本概况 DeepSeek 是由杭州深度求索人工智能基础技术研究有限公司 “ (简称 深度 求索 ”)开发的一系列人工智能模型。该模型拥有数以亿计甚至更多的参数,通 过在海量文本数据上进行预训练,学习到丰富的语言结构和语义信息;并支持智 能对话、准确翻译、创意写作、高效编程、智能解题和文件解读等多种功能。其 “深度思考 ” “ 和 联网搜索 ”功能能够更全面地理解用户问题并提供准确答案。 杭州深度求索人工智能基础技术研究有限公司公司成立于 2023 年 7 月 17 日,专注于开发先进的大语言模型(LLM)和相关技术。 自成立以来,公司在 AI 领域取得了显著成果,主要使用数据蒸馏技术,得到更为精炼、有用的数 据。 2024 年 1 月 5 日,发布 DeepSeek LLM(深度求索的第一个大模型), 目 前, DeepSeek-R1 、V3 、Coder 等系列模型已上线国家超算互联网平台。英伟 达称, DeepSeek-R1 是最先进的大语言模型,亚马逊和微软也接入 DeepSeek-R1 模型。 DeepSeek 大模型在多个基准测试中表现优异,尤其是在代码和数学任务 上,超 越了其他开源模型,甚至与领先的闭源模型(如 GPT-4 和 Claude-3.5- Sonnet ) 不相上下。 DeepSeek 被业界认为“ 以高性价比著称的 AI 模型服务商”,原因是这家公 司 的出现极大地降低了大模型训练和应用的成本,如该公司开发的 DeepSeek- V3 训练成本仅 557.6 万美元,而 OpenAl 训练 GPT-4 所花费的成本高达 7800 万 美元 甚至是 1 亿美元,双方的成本相差至少 10 倍。DeepSeek-V3 在数学、代 码能力 和中文知识问答方面还超过了 GPT-4 ,可以说是性价比超高。此 外,DeepSeek 团队只有 139 名研发人员,而开发 GPT 的 OpenAl 团队则有 1200 名研究人员。 在审计领域,DeepSeek 大模型能够帮助审计人员高效处理各类多源异构的 审计数据、识别风险、提升审计质量;通过自动化的数据处理、智能化的风险 识 别和定制化的报告生成等功能,帮助审计人员降低人工成本、提高审计质量 和效 率。 2. DeepSeek 主要版本 目前,DeepSeek 的核心版本主要有 DeepSeek-V3、DeepSeek-R1、Janus Pro, 表 1 中列出了这 3 个核心版本的特点和适用场景。 表 1 DeepSeek 核心版本与适用场景 模型版本 发行时间 模型大小 核心能力 适用场景示例 DeepSeek-V3 2024-12-26 671B 通用自然语言处理(NLP),支 持 长文本理解、多语言交互 合同条款解析、政策法规 匹配、审计报告生成 DeepSeek-R1 2025-1-20 671B 复杂逻辑推理,强化数学与 代码生成能力 财务数据分析、异常检测、 风险建模 DeepSeek Janus Pro 2025-1-28 7B 多模态(文本+ 图像+表 格) 理解与生成 票据识别、图表数据关联 分析、可视化报告 这三个版本原始模型权重已经在 hugging face 上开源,用户可以免费下载。 国 内 使 用 可 以 通 过 其 镜 像( https://hf-mirror.com/ ) 获 取 。DeepSeek-V3 和 DeepSeek-R1 的模型参数量较大,达到了 671B ,直接部署这两个模型需要 1.3~2 TB(FP16)的显存支持(如 128 卡 H100 的集群)。为方便一般用户本地 使用, DeepSeek 团队使用 Qwen2.5 和 Llama3.3 ,以 DeepSeek-R1 为教师模 型,蒸馏了 6 款小模型,包含 1.5B~70B 在内共有 6 个尺寸,如表 2 所示。 表 2 DeepSeek-R1 蒸馏的 6 个尺寸的模型 蒸馏的模型 基座模型 下载地址 DeepSeek-R1-Distill-Qwen-1.5B Qwen2.5-Math-1.5B HuggingFace DeepSeek-R1-Distill-Qwen-7B Qwen2.5-Math-7B HuggingFace DeepSeek-R1-Distill-Llama-8B Llama-3.1-8B HuggingFace DeepSeek-R1-Distill-Qwen-14B Qwen2.5-14B HuggingFace DeepSeek-R1-Distill-Qwen-32B Qwen2.5-32B HuggingFace DeepSeek-R1-Distill-Llama-70B Llama-3.3-70B-Instruct HuggingFace 即使经过了蒸馏,7B 模型也需要 20~25G 的显存,即使是 24G 的 4090 显 卡, 部署也存在一定的风险。为此,在个人使用时,很多会将这类模型进行进一 步量 化,以缩减模型大小,ollama 官方拉取的 DeepSeek 模型即是通过 4bit 量化后 的 模型。 这里需要注意:无论是模型蒸馏还是量化,都会或多或少降低模型的能力。 3. DeepSeek 审计能力 (一)数据采集与预处理 DeepSeek 支持多种数据源的接入,包括财务系统、ERP 系统和数据库 等, 确保数据获取的全面性。 通过数据清洗、缺失值填补、异常值检测和格式转换等操作,DeepSeek 能够 自动清洗、转换和整合数据,确保数据质量,并将不同来源的数据统一格式 化, 为后续分析提供高质量的数据基础。 (二)数据分析与挖掘 DeepSeek 提供多种数据分析工具,如趋势分析、比率分析和异常检测等, 帮助审计人员快速识别潜在的风险区域。DeepSeek 还可以进行时序分析,揭示 财务数据中的潜在问题。 DeepSeek 利用机器学习算法识别潜在风险和异常交易,通过结合历史数据 训练风险识别模型,实时监控异常交易、非正常模式和潜在的舞弊行为。 (三)支持自定义分析模型 用户可以根据具体审计需求自定义分析模型,针对特定场景(如税务审计、 资产管理审计等)设定独特的分析参数。 (四)风险识别与评估 DeepSeek 基于预设规则和机器学习模型识别潜在风险领域,通过预设的审 计规则和数据驱动的机器学习模型,自动识别潜在风险区域,帮助审计人员发 现 财务漏洞、操作风险或法律风险。 DeepSeek 会对识别出的风险进行评估和排序,根据风险的严重程度、发生 概率和影响范围, 自动评估并排序,帮助审计人员优先处理最关键的风险点。 (五)审计证据收集与管理 通过 DeepSeek 的自动化分析,系统能够生成详细的审计底稿,包括审计过 程、分析方法、数据来源及审计结果等内容,确保审计工作的透明性和可追溯性。 DeepSeek 支持审计证据的电子化存储和管理,审计证据以电子形式存储, 支持文档管理、版本控制和权限管理,方便审计人员快速查阅和追溯。 (六)可视化与报告生成 DeepSeek 提供丰富的可视化图表,包括图表、热力图和流程图等,帮助审 计人员直观展示分析结果,提升报告的可读性和说服力。 系统能够自动生成标准化的审计报告,包含详细的数据分析结果、风险评估 和审计结论等内容,显著减少报告编写时间。 4. DeepSeek 部署方法 使用 DeepSeek 主要有三种渠道:官方渠道、第三方渠道、本地部署。这 三 种渠道各自特点如表 3 所示。 表 3 DeepSeek 三种使用渠道对比 渠道 优点 缺点 官方渠道 功能齐全、操作简单(联网搜索/ 跨设备同步) 高峰期易崩溃,取决于流量,看运气 第三方渠道 规避官方崩溃风险,国产 GPU 加速或白嫖算力 功能受限(如对话记录不保存),需实名认证 /复杂配置 本地部署 隐私性强、永久离线,定制化 模型选择 依赖硬件性能(需高配电脑),技术门槛较高, 大部分部署的是蒸馏版本 4.1 官方渠道 DeepSeek 官方分为网页版和移动版,网页版用户点击“开始对话”并注册后 即可使用;移动版需通过手机下载注册后使用,两者功能相同。 4.1.1 网页版使用 访问链接:https://chat.DeepSeek.com/,可以在任何设备和浏览器打开。之 前 从未登录过的用户需要进行登陆,使用手机号、微信或者邮箱登陆即可。如 图 1 所示,输入自己的手机号,点击发送验证码,然后可以通过接收到的验证码登 录 即可。 图 1 DeepSeek 注册页面 登录成功后,进入图 2 “ 所示界面,然后点击 开始对话 ”就可以使用。 图 2 DeepSeek 官方网站主界面 不过需要注意,那就是如何选择 V3 还是 R1 模型,可以参考下图。此外还 “ 可根据需要,选择是否勾选 联网搜索 ”。 图 3 不同版本的 DeepSeek 选择 4.1.2 手机版使用 手机版的使用和电脑版基本一样,根据需要是否激活 R1 即可。唯一不同 的 是需要在手机安装对应的 App 。安装方法如下: 方法 1 :进入 DeepSeek “ 官网后,将鼠标移动至 获取手机 APP ”处,扫描 弹出的 APP 下载二维码(https://download.DeepSeek.com/app/),然后选选择对 应 的下载渠道即可。 方法 2 :在手机自带的应用商城中,搜索 DeepSeek ,点击下载安装即可。 4.2 第三方渠道 随着 DeepSeek 模型迅速走红,官方平台面临访问量激增的压力,经常遇到 服务拥堵的情况。不过,国内主流云计算平台已全面接入 DeepSeek 模型,为用 户提供 了稳定可靠的替代方案 。 这些非官方 渠道提供 了 三类模型选择: DeepSeek-V3 模型、完整版 DeepSeek-R1 模型(671B 参数)、轻量级 DeepSeek- R1 模型(参数规模从 1.5B 到 70B 不等)。其中,完整版 R1 模型保留了全部 671B 参数,能发挥出最佳性能,但对计算资源要求较高,通常需要支付一定费 用。轻 量级模型则通过知识蒸馏技术,在保持核心功能的同时大幅降低了参数 规模,可 在普通算力环境下流畅运行,为用户提供了更灵活的选择。 4.2.1 硅基流动&华为云 硅基流 动与 华 为云 团 队联合 首 发 并 上 线 了基 于 华 为云 昇腾云服 务 的 DeepSeek R1/V3,推理服务目前支持 V3 和 R1 大模型,以及多款 R1 蒸馏小模 型。 在 硅 基 流 动 的 一 站 式 大 模 型 云 服 务 平 台 SiliconCloud 上(网 址 为 : https://siliconflow.cn/zh-cn/),用户注册后可以在网页右侧选择 DeepSeek-R1 等模 型进行体验使用,如图 4 所示。 图 4 硅基流动模型广场主界面 4.2.2 纳米 AI 搜索 360 宣布在其旗下纳米 AI “ 搜索中开通 DeepSeek 高速专线 ”,用户可在手 “ 机应用商店中下载并安装 纳米 AI 搜索 ” “ ,注册登录后点击底部 大模型 ”,进 入 如图 5 “ 所示左边画面。随后选择 DeepSeek-R1-满血版高速专线 ”,即可进入 图 5 所示右边画面。接着就可以在下面的输入框中输入你需要的问题了。 图 5 360 纳米 AI 搜索 app 4.2.3 阿里云 阿里云 PAI Model Gallery 支持用户通过云平台一键部署 DeepSeek-V3 、 DeepSeek-R1 模型及其蒸馏版本。用户
下载文档到本地,方便使用
- 可预览页数已用完,剩余 25 页请下载阅读 -
文档评分
请文明评论,理性发言.