导则 - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

DeepSeek大模型赋能高校教学和科研2025

文案创作、逻辑推理、多模态理解、多语言支持的能力。通义千问这个名字有“通义”和“千问”两层含义， “通义”表示这个模型能够理解各种语言的含义， “千问”则表示这个模型能够回答各种问题。通义千问基于深度学习技术，通过对大量文本数据进行训练，从而具备了强大的语言理解和生成能力。它能够理解自然语言，并能够生成自然语言文本 n ，为用户提供高质量、高效率、高个性化的内容服务 5.1.1 什么是 AIGC 大模型与 AIGC 之间的关系可以说是相辅相成、相互促进的。大模型为 AIGC 提供了强大的技术基础和支撑，而 AIGC 则进一步推动了大模型的发展和应用大模型和 AIGC 的结合，也带来了广泛的应用前景 AIGC 的需求也推动了大模型的发展大模型为 AIGC 提供了丰富的数据资源和强大的计 i nd 软件，通过文件 - 导入 - Ma rkdow n 进行文件的导入，最后就能马上渲染出一个非常完美的思维脑图。将我们准备好的电子书上传到 Dee p Seek ，并输入提示词：现在我需要做一个 x m i nd 思维导图，请帮这份文档输

10 积分 | 123 页 | 15.88 MB | 1 年前
3
浙江大学-DeepSeek模型优势：算力、成本角度解读2025

L=(Cmin/2.3·108) )-0.050 10-3 10-1 Compute PF-days,non-embedding 大模型指导法则 Scaling Law: 富则火力覆盖数据集模型参数量 7 6 5 4 3 ---- 2+ 10-9 Dataset Size tokens Parameters non-embedding GQA MLA MLA N.A 上下文长度 4K 128K 128K 128K 训练成本 (GPU Hours) 300.6K 172.8K 2.788 M 30.84 M 发展历程：穷则战术穿插 DeepSe ek DeepSeekMoE Routed Expert Shared Expert Feed-Forward Network Router hll Top-K, OOO0 … … OOOO Input Hidden ut ■ 核心技术 DeepSeekMoE: 显者减少计算量 ( 穷则战术穿插 ) ■ 针对美国的算力禁令 ■ 核心思想： 1 共享专家 +256 路由专家，激活 8 个路由专家 ■ 共享专家：捕获通用知识、降低知识冗余 ■ 路由专家：量大、细粒度、灵活组合、方便知识表达

10 积分 | 23 页 | 7.53 MB | 1 年前
3
AI跃迁派：2025年DeepSeek零基础完全指南

知识管家：自动整理会议录音→生成思维导图→提炼待办事项 ⚫ 语言翻译：支持 42 种语言互译，自动适配文化差异（如把“摆烂”翻译成 “quietquitting”）局限：复杂逻辑问题需升级至 R1 版本模块 2：深度思考（R1）——决策智囊团技术突破： ⚫ 思维链可视化：像老师写板书一样展示推理步骤（如解方程时先分解条件再推导） ⚫ 反事实推演：模拟“如果特斯拉降价典型应用场景： ①学生党：从题海战术到精准学习 ⚫ 论文润色：上传论文草稿→输入“优化学术表达，确保符合 APA 格式”→10 分钟完成专业级修改 ⚫ 知识点图谱：输入“用思维导图整理高中生物遗传学核心概念”→生成可打印的学习框架 ⚫ 解题思路：拍摄数学题照片→R1 模式自动分步解析，错误点用红框标注 ②职场人：效率提升 300%的办公神器 ③创业者：零成本搭建专业团队

10 积分 | 21 页 | 1.01 MB | 1 年前
3
英特尔-工业人工智能白皮书2025年版

技术的应用正为工业领域带来前所未有的创新性变革。而且，工业领域对 AI 技术的部署，正在随着 AI 技术本身的发展和工业应用复杂性的增加，日渐从传统的 AI 技术向更加复杂的工业大模型过渡。传统 AI 技术则主要基于规则和知识库实现智能工作，它通常使用神经网络结构，通过大量数据进行训练，来获得较好的性能。传统 AI 具有较强的实时性，能在特定场景下快速解决问题。但是，对于更加复杂的多样化应用场景，比如需要处理文处理器在全范围工作负载上表现出色，其主流系列产品拥有 8-86 个内核，在基于双 CPU 的系统中，网络和存储外接卡拥有多达 176 个 PCIe 5.0 通道，而基于单 CPU 的系统中，单插槽产品则拥有 136 个 PCIe 通道。所有英特尔® 至强® 6 处理器都能随着服务器利用率的增加而提供可扩展的每瓦性能，在整个负载线路上提供近乎线性的功耗-性能消耗，这凸显了所有英特尔® 至强® 6 Interconnect，英特尔® UPI）2.0 的跨插槽内带宽速度高达 24 GT/s，与上一代产品相比提升高达 20%。 • 双路服务器拥有多达 178 条 PCIe Gen 5 通道，单路服务器则多达 136 条，可以支持重要的 I/O 附加组件，包括加速器、网络适配器、存储控制器和存储。 • 多达 64 条 Compute Express Link (CXL) 2.0 通道，每条通道的数据传输速率高达

0 积分 | 82 页 | 5.13 MB | 1 年前
3
华为昇腾DeepSeek解决方案

网络级负载均衡实现网络动态路由，有效吞吐达 98% 控制器全局集中算路自动生成路径并动态下发网络获取网络拓扑网络局部计算选路 Hash 冲突导致有效吞吐不足 50% 拥塞空闲超大集群线性度 90%+ L2 层下发路径 L1 层分布式并行风险评估、法律文档审核、智能流程智能问答、文本摘要、法律 / 医疗咨询智慧政务、金融风控、医疗辅助、企业办公、知识问答、思维导图 …… 教育科研、办公应用 19+ 生态伙伴基于昇腾推出一体机方案，满足不同行业场景需求 OEM 伙伴 APN 智能客服、内容创作、医疗影像 AI PC 工作站，本地办公应用

0 积分 | 32 页 | 2.52 MB | 1 年前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

程，以确保答案的准确性。 ➢ 反思是指模型会回溯检查自己之前的推理过程，并根据检查的结果进行修正，相当于一个学生在复习时，会反思自己之前的错误，以便下次不再犯同样的错误。 ➢ 而长链推理能力则让模型能够处理更复杂、更需要多步骤思考的问题。这种能力对于解决一些需要跨越多个逻辑步骤才能找到答案的问题至关重要，例如复杂的数学题或逻辑谜题。 ➢ 冷启动让RL训练更加稳定： ➢ 避免 RL ，首先利用一些带有推理过程的 Few-Shot Examples 来 Prompt 模型对于数据集中的问题生成对应的推理过程和答案。 ➢过滤：如果生成的答案正确，则将推理过程加入到原有的数据集中；如果生成的答案错误，则尝试在给出正确答案的前提下再次生成推理过程。将最终生成正确答案的推理收集，构建一个构建一个微调数据集 [Question, Rationale, Answer ] 进行微调。 ➢迭代：重复这一

10 积分 | 76 页 | 8.39 MB | 1 年前
3

共 6 条前往

页

分类

语言

格式

DeepSeek大模型赋能高校教学和科研2025

浙江大学-DeepSeek模型优势：算力、成本角度解读2025

AI跃迁派：2025年DeepSeek零基础完全指南

英特尔-工业人工智能白皮书2025年版

华为昇腾DeepSeek解决方案

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告