浙江大学:DeepSeek的本地化部署与AI通识教育之未来
38.75 MB
57 页
0 下载
31 浏览
0 评论
0 收藏
| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pdf | 3 |
| 概览 | ||
1 2025年3月9日星期日 DeepSeek的本地化部署与AI通识教育之未来 陈建海 博导/副教授 浙江大学通识人工智能(A)(理工农医)课程团队负责人 浙江大学计算机科学与技术学院 基础教学中心副主任/支部书记 浙江大学智能计算与系统实验室 负责人 浙江大学人工智能教育教学研究中心 2 提纲 vDeepSeek AI的新时代背景 vDeepSeek的本地化部署实践 vDeepSeek与AI通识教育之未来 v总结 3 提纲 vDeepSeek AI的新时代背景 vDeepSeek的本地化部署实践 vDeepSeek与AI通识教育之未来 v总结 4 我们进入了一个怎样的时代 人工智能的新时代 农耕时代 互联网时代 大数据时代 智能化 互联网大数据引来智能化 信息技 术革命 5 生成式人工智能:AIGC盛行(文生文、文生图、文生视频.....) 由LumaAI大模型DreamMachine生成的视频 6 过去、现在和未来-人机共存时代 人机共存时代即将到来 元宇宙世界 现实世界 未来世界 数字分身 过 去 现 在 未 来 7 人工智能(AI)无处不在的时代 智能图像理解 智能美图 新闻推荐 智能搜索排序 智能出行 自动驾驶 智能会话 智能助理 机器翻译 个性化推荐 智能物流 仓储机器人 识别:语音、人脸、视频内容 应用:安防、客服。。。 BI:商业流程自动化 互联网数据 购买转化、商品推荐、定价、精准 营营销、社交媒体营销 券商股票:智能+量化交易、智能 投顾、机器人理财 银行、保险应用:针对性电话营销、 贷款审批、信用卡欺诈 医学:自动读片、辅助诊断、个性 化诊断、基因排序 教育:学习外语、智能选题 8 人工智能(AI)无处不在的时代 扫地机器人 食堂扫脸付款 门禁刷脸识别 停车场门禁 无人机 自动驾驶 人形机器人 大语言模型 ...... sora文生视频 Stable Diffusion 9 人工智能的起源、定义——没有统一标准 人的智能 Artificial Intelligence 人工智能 智能是智慧和才能的总称 机器 人工方法和 技术模拟 1956年8月,达特茅 斯会议人工智能诞生 而后到今天发展了三大 主义学派 (1) 正名篇:所以知之在人者谓之知,知 有所合谓之智。所以能之在人者谓之能,能 有所合谓之能。 人工智能是以机器为载体用人工方法 和技术模拟实现的人的智能 (2)多元智能理论:语言智能、音乐智能、 逻辑智能、空间智能、运动智能、人机智 能、认知智能 10 从人的智能到人工智能 荀子·正名篇:人的智能,智慧和才能的总称 智慧 知识 所以能之在人者谓之能,能有所合 谓之能。 所以知之在人者谓之知,知有所合 谓之智。 才能 能力 《荀子·正名篇》 心 脚 手 肉 骨 肺 肠 胃 脾 眼 鼻 耳 舌 口 脑 脸 头 腿 身 体 听觉 看 味觉 吃 触觉 嗅觉 视觉 舔 闻 听 拿 撑 撑 血 行、走 跑、跳 哭笑 痛觉 消化 系统 思考 记忆 想象 臀 呼吸 系统 血液 系统 人(主体)所固有的认识外界客观事物(客体 对象)的本能为“知”,主体认知能力与客体 事物相接触联通所产生的认知叫作“智慧”。 人(主体)固有的能力叫作“能”,主体的 能力与客体对象接触联通后所形成的能力为 “才能”。 “智”在内,往往在心里,常说“心智”, 跟人的心脑直接相关。 “能”在外,“能力”一般是外在通过某种形式表现出来的,跟身体架构整体有关。 直觉 11 多元智能理论 (1983 年,哈佛大学发展心理学家霍华德·加德纳(Howard Gardner) 教授) 语言智能 音乐智能 逻辑智能 空间智能 运动智能 人机智能 认知智能 12 DeepSeek来了,它是谁? v DeepSeek全称 – 杭州深度求索(DeepSeek)人工智能基 础技术研究有限公司,创始人:梁文锋 – 幻方量化基金,2023年7月17日成立,专 注开发大模型及相关技术 v DeepSeek——高性能、低成本的国产开 源大模型 v DeepSeek大模型产品 – DeepSeek-Math – DeepSeek-Coder – DeepSeek-Math – DeepSeek-VL、VL2 – DeepSeek-V2、V2.5 – DeepSeek-V3 – DeepSeek-R1 – DeepSeek-R1-Zero – ... 1.DeepSeek简介 浙江大学学子 13 DeepSeek是什么 高性能、低成本的、国产开源大模型! • DeepSeek-R1发布开源,擅长处 理复杂且在训练阶段大规模使用 了强化学习技术,在仅有极少标 注数据的情况下,极大提升模型 推理能力。 • DeepSeek-R1在数学、代码、自 然语言推理等任务上,性能比肩 OpenAl o1正式版。 • 目前大模型主流榜单开源模型 DeepSeek-V3 位列榜首,与世 界上最先进的闭源模型不分伯仲。 14 蒸馏小模型的性能超越 OpenAI o1-mini v 基于DeepSeek-V3训 练DeepSeek-R1-Zero 和 DeepSeek-R1 v DeepSeek-R1 的输出, 蒸馏了 6 个小模型开 源给社区 v 其中 32B 和 70B 模型 在多项能力上实现了 对标 OpenAI o1-mini 的效果。 15 DeepSeek的惊天动地事迹 2024.1.25: 发布DeepSeek-Coder 2024.1.5: 发布第一个大模型: DeepSeek LLM 2024.2.5: 发布DeepSeekMath 2024.3.11:发布 DeepSeek-VL 2024.5.7: 发布DeepSeek-V2 2024.6.17:发布DeepSeek-Coder-V2 2024.9.5: DeepSeek V2.5(合并 DeepSeek Coder V2 和 DeepSeek V2 Chat ) 2024.12.13: 发布DeepSeek-VL2 2024.12.26: 正式上线DeepSeek-V3首个版本并同步开源 2025.1.31: DeepSeek-R1模型登陆英伟达 NVIDIA NIM,同时:接入亚马逊、微软... 2025 2024 2025.2.5: DeepSeek-R1、V3、Coder 等系列模型, 陆续上线国家超算平台... 2025年1月:GitHub发布Janus-Pro多模态大模 型,进军文生图 2025.2.6日: 中国电信、中国移动、中国联通三大运营商宣布接入DeepSeek 近期:各行业开始研究部署... 1.DeepSeek简介 16 DeepSeek是谁?咱们通俗说一说...... 基于 Llama 、 Qwen 六个密集模型 (1.5b、7b、8b、 14b、32b、70b) 大师 徒弟 蒸馏版 训练 DeepSeek- R1- Zero DeepSeek- R1 蒸馏 满血版 DeepSeek-V3 671b 17 DeepSeek破圈席卷全球 1.DeepSeek简介 开源AI大模型和相关技术火爆全球,DeepSeek一度在140 多个国家的应用商店下载排行首位。 DeepSeek—有史以来最快获得1亿注册用 户的APP。 18 DeepSeek多场景全面接入 v 三大基础运营商、超过15家芯片厂家、 200多家企业(涉及云服务、网络科技、 金融等领域)、多个手机厂商和车企,以 及地方政府政务系统等。 v 世界级的云计算巨头:微软、英伟达、亚 马逊宣布接入DeepSeek。 v DeepSeek的“朋友圈”瞬间扩大,引领 大模型在AI领域的创新应用 19 DeepSeek多场景全面接入(比如:钉钉) 20 DeepSeek能做什么(ChatGPT 能的DeepSeek也能做) • 直接面向用户或者支持开发者,提供:智能对话、文本生成、语义理解、计算推理、代码生成补全 等应用场景,支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中 的文字内容。 简历修改 解题助手 撰写产品痛点分析 语法纠正 写工作汇报 关键字提取 约会辅助 论文语法检查 AI绘画功能 人群画像分析 写行业报告 礼品推荐 论文格式检查 英语情景对话练习 影视脚本创作 写商业计划书 访谈嘉宾推荐 文献参考检查 英语单词造句 汇总视频会议要点 学英语 内容简要综述 检查标点错误 英语作文评价 心理咨询 模拟面试 撰写行业调研分析 外文翻译 英语作文改写 虚拟恋爱 做Excel表 设计用户访谈大纲 英文润色 学习计划和课程推荐 问诊疾病 写小说 制作用户体验地图 列出SEO关键词 文本扩充 分析财务情况 论文提纲生成 撰写特性体验测试大纲 图片搜索 个性化护肤品推荐 生成邮件、公文 解释概念 网络舆情分析 段落创作 定制化风格写代码 写代码 自动回复邮件 个性化健康建议 生成代码框架 计划行程 识别和过滤色情内容 生成真人演讲 进行用户访谈 撰写数据分析报告 改写文案 宠物科学喂养计划 AI修图 AI时间管理 产品取名 视频时间轴标记 房屋装修建议 AI写简历 快速生成影评 AI会议记录 预测市场趋势和风险 分析社会政治事件 撰写标题 分解复杂句式 优化设计创意 减肥健身计划 交通规划 生成图片 优化电商listing 面试问题准备 撰写营销文案 家庭情感咨询 模拟人类行为 撰写广告策划案 头脑风暴 找代码Bug 生命基因科学分析 生成音乐和声音 美食制作 程序代码解释 协助运营社交媒体 社区建设公益指导 历史科普 训练为AI客服 询问多路径中的最佳选择 AI摆烂聊天 社会服务 过滤垃圾短信 设计旅游攻略 撰写和分析法律合同 文字转表格 工业制造建议…… ChatGPT的100个功能 21 提纲 vDeepSeek AI的新时代背景 vDeepSeek的本地化部署实践 vDeepSeek与AI通识教育之未来 v总结 22 什么是DeepSeek的本地化部署 v DeepSeek的本地化部署是指将人工智能系统(如模型、算法及服务)部署在用户指定的本地服务 器或基础设施中,而非依赖云端服务,旨在实现数据主权掌控、文化适配优化和合规性保障的技 术方案。其核心是通过技术与场景的深度结合,满足特定区域、行业或机构的个性化需求。 2.DeepSeek的部署 本地 云端(远端、部门外部) 普通电脑 服务器 基础设施 单位使用 个人使用 部署 23 本地化部署的优点 v 1. 数据隐私安全 v 2. 法律合规性 • 数据主权:满足GDPR、HIPAA等法规对数据 存储位置的要求(如数据不得跨境传输)。 • 行业合规:适应金融、政务等行业的本地 化数据监管政策,避免法律纠纷。 v 3. 性能优化与低延迟 • 实时响应:本地处理消除网络延迟,提升高频 交互场景(如客服、实时翻译)的体验。 • 资源独占:硬件资源专用于模型推理,避免云 服务多租户环境下的资源争抢。 v 4. 高度定制化 • 模型微调:可根据企业垂直领域(如法律、医 疗)调整模型参数,提升专业场景的准确性。 • 系统集成:灵活对接内部数据库、ERP等系统, 实现个性化功能。 • 版本控制:自由选择或回滚模型版本,避免云 服务强制更新导致的兼容性问题。 v 5. 长期成本效益 • 减少云服务依赖:避免持续支付API调用费 用,尤其在高频使用场景下成本优势显著。 • 硬件自主规划:可按需选择服务器配置,平 衡性能与预算,长期摊销硬件投入。 v 6. 稳定性和可靠性 • 规避云服务风险:不受供应商服务中断、 API限制或政策变动影响,保障业务连续性。 • 灾备可控:可自主设计备份和容灾方案,提 升系统鲁棒性。 v 7. 技术自主性 • 避免供应商锁定:掌握核心技术栈,减少对 第三方平台的依赖,保障长期战略灵活性。 • 知识产权保护:模型与数据的本地化管控降 低知识产权外流风险。 •敏感数据保护:数据无需上传至第三方云端,避 免传输和存储过程中的泄露风险,适合医疗、金 融、政府等敏感领域。 •完全控制:企业自主管理数据访问权限,降低外 部攻击或内部滥用风险。 •符合安全审计:本地环境更容易满足严格的安全 审计要求(如ISO 27001)。 缺点:成本高 24 DeepSeek的连接官网简单使用 v 连接官网 – https://chat.deepseek.com – 首次使用注册一个账户 • 手机号或邮箱地址 注册账户 聊天界面 1.DeepSeek简介 25 基于ollama的本地run(macos或者linux) v 安装ollama的包 – pip install ollama v 基于ollama运行DeepSeek – 运行1.5b模型 • ollama run deepseek-r1:1.5b – 运行7b模型 • ollama run deepseek-r1:7b – 运行8b模型 • ollama run deepseek-r1:8b • ... 1.DeepSeek简介 26 DeepSeek 手机版的扫码安装和简单使用(手机里面使用) 27 DeepSeek的部署 v Deepseek系列模型包括V3(671b)、R1(660b)和基于DeepSeek-R1蒸馏的模型,如下表。 v 教育和科学领域任务需求,包括智能问答系统、学习辅助工具、数据分析助手、论文摘要生成等任务,可以基于deepseek 搭建和部署本地的小模型环境。 模型版本 显存VRAM (GPU) 内存RAM (CPU) 本地存储 运行机器 R1-1.5b 4GB+ 8GB+ 5GB 个人普通机 R1-7b 12GB+ 16GB+ 10GB 个人普通机 R1-8b 16GB+ 32GB+ 15GB 个人普通机 R1-14b 24GB+ 64GB+ 30GB 专用服务器 R1-32b 48GB+ 128GB+ 60GB GPU服务器 R1-70b 80GB+ 256GB+ 120GB GPU服务器 V3\R1-671B (MoE) 4*A100 GPUs (320GB VRAM) 512GB 500GB+ 高端GPU服务器 v DeepSeekR1蒸馏版均可进行本 地化部署。 v 小规模的1.5b-8b的可部署在普 通机,其余需要GPU。 v 全量版MoE671b:无法直接本地 部署,但有压缩的动态量化版本 实现本地化,需高端GPU服务器。 2.DeepSeek的部署 28 DeepSeek部署的前期准备-机器环境 v TO-C(个人) v 机器:个人笔记本、台式机 v 选择版本:1.5b、7b、8b v 配置要求: – 内存:建议16GB以上 – CPU 性能越好,有带GPU更好 – 根据配置选择部署的大模型版本:1.5b、7b、 8b、14b或更高版本 – 普通电脑1.5b的效果不错 v 操作系统:Windows、Linux、MacOS v 软件:python及相关的包、库等。 2.DeepSeek的部署 v To-B(单位) v 单位:服务器或基础设施(带GPU) v 选择版本:14b、32b、70b v 配置要求: – 内存:建议64GB以上 – CPU 性能越好,有带GPU更好 – 根据配置选择部署的大模型版本 – 操作系统:Linux v 软件:python及相关的包、库等。 29 Ollama的本地化部署-下载和安装【速度超级快】 windows下 DeepSeek的部 署 http://www.ollama.com 30 DeepSeek本地服务的安装 下载完成后 开始安装 正在安装 安装完成后的运行 31 Deepseek模型的本地运行和使用-ollama [windows的命令行运行] 模型正在下载 DeepSeek-R1:1.5b 的模型下载完毕 DeepSeek模型使 用对话 32 DeepSeek本地版-基于Page Assist for Ollama(网页版) v Page Assist是浏览器插件,基于本地AI模型的Web UI工具,可视化的模型对话,提供便捷的交互界面, 支持视觉模型和文档交流功能 v Page Assist for Ollama官网入口网址:https://openi.cn/sites/143085.html,下载插件: https://www.chajianxw.com/product-tool/85997.html 33 Page Assist的使用 34 提纲 v1. DeepSeek AI的新时代 v2. DeepSeek的本地化部署实践 v3. DeepSeek与AI通识教育之未来 v总结 35 国家战略呼吁“人工智能+”行动,各高校陆续推进人工智能通识教育 v 2024年政府工作报告,首次被明确 提及“人工智能+”行动,人工智能技 术在国家战略中的重要地位。 v 各高校陆续面向全校开展人工智相关课程,旨在培养适应 未来社会发展需求的新型人才。 – 2024年2月南京大学宣布面向全体新生开设人工智能通识核 心课程。 – 2024年6月19日浙江大学发布了《大学生人工智能素养红皮 书》 《教师人工智能素养红皮书》 ,成立大学人工智能教 育创新联盟,2025年2月面向全校开设人工智能通识课。 – 复旦大学将在2024-2025学年推出至少100门AI领域课程, 加快AI+融合创新人才培养新局面。 – 7月29日,在十四届全国政协第22次双周协商座谈会上,教 育部副部长吴岩提到要:打造人工智能通识课程体系。 36 浙江大学成立人工智能教育教学研究中心 2024年3月,浙江大学成立人工智能教育教学 研究中心,统筹全校教育、科技、人才优势, 整体规划和统筹协调人工智能通识教育教学改 革,打造人工智能通识课程体系和实训范式, 直面“智能时代、教育何为”挑战,让更多人 成为人工智能这一通用智能技术的受益者。 构建人工智能类本研公共课程体系 出版人工智能系列高水平教材 打造人工智能系列人才培养项目 组建跨学科高水平师资队伍 强化核心实践创新能力培养 推进人工智能赋能教育教学 发布人工智能系列研究报告 课程体系 实践平台 培养项目 师资队伍 实践平台 赋能教学 素养要求 教材是实处 · 课程是深处 · 实践是难处 · 师资是痛处 作为中心一员,承担理工农医人工智能通识基础课程建设 37 浙江大学组建跨学科高水平人工智能师资队伍 浙江大学人工智能通识教育师资培训班 人工智能基础通识课程教材建设研讨会 集体备课会 自2024-2025学年春夏学期起,浙江大学每年将面向全校本科生开设人工智能 通识课程。各学院(系)设立人工智能教育教学工作牵头教师,组建百人以上 教师的跨学科教学团
| ||
下载文档到本地,方便使用
共 57 页, 还有
1 页可预览,
继续阅读
文档评分


浙江大学-DeepSeek模型优势:算力、成本角度解读2025
Deepseek大模型在银行系统的部署方案设计