Agent - 信息化解决方案--维度跃迁 —— IT方案库， IT 世界的跃迁密码，让复杂问题迎刃而解!

首页上传文档发布文章登录账户

DeepSeek大模型赋能高校教学和科研2025

智能体本身既不是单纯的软件也不是硬件，而是一个更为宽泛的概念，它们可以是软件程序、机器人或其他形式的系统，具备一定的自主性和智能性智能体（ AI Agent ），又称“人工智能代理” ，是一种模仿人类智能行为的智能化系统，它就像是拥有丰富经验和知识的“智慧大脑” ，能够感知所处的环境，并依据感知出跨领域的应用潜力 AI Agent 的诞生就是为了处理各种复杂任务的，就复杂任务的处理流程而言 AI Agent 主要分为两大类：行动类、规划执行类。总而言之， AI Agent 就是结合大模型能去自动思考、规划、效验和执行的一个计算体，以完成特定的任务目标，如果把大模型比作大脑，那 AI Agent 可以理解为小脑 + 手脚手脚 6. 基于大模型的智能体 AI Agent 的工作仅需给定一个目标，它就能够针对目标独立思考并做出行动，它会根据给定任务详细拆解出每一步的计划步骤，依靠来自外界的反馈和自主思考，自己给自己创建 prompt ，来实现目标目前各类 AI Copilot 不再是机械地完成人

10 积分 | 123 页 | 15.88 MB | 10 月前
3
山东大学：DeepSeek 应用与部署

技术创新—模型架构 | V3 PPO ： Proximal Policy Optimization GRPO ： Group Relative Policy Optimization 强化学习让智能体（ Agent ）在环境（ Environment ）中不断尝试、学习，并优化自己的策略（ Policy ），最终获得最大化的奖励（ Reward ）。 DeepSeek ：数据库工程 RAG 中的 Embedding 模型 Embedding 模型贯穿 RAG 流程多环节 Cherry LM+DeepSeek API 大模型智能体工程五大 AI Agent 多智能体开发框架微软 Magentic-One Git hub 地址： https://github.com/micr osoft/autogen/tree/ main/python/packages/autogen-

10 积分 | 79 页 | 6.52 MB | 10 月前
3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告

未来更多是能否利用强推理能力赋能Agent和具身智能 ➢ OpenAI Deep Research Agent ➢ Anthropic PC Controller ➢ 需要依赖于强推理模型反思、长程规划、Tool Use 工具调用等能力 ➢ 内存和记忆模块的挑战需要克服，小模型如何获得强推理效果？ [1] https://lilianweng.github.io/posts/2023-06-23-agent/ ➢ 与此同时，安全价值的监管具有多元性: 人类的安全价值观具有多样性，内建价值冲突 \ 单智能体系统下的安全，并不保证多智能体系统安全 \AI系统伪装已被“安全对齐”，行为欺骗监管 ➢ 随着 VLA \ Agent 等模型下游和赋能应用兴起，确保模型AI系统准确应对不确定性，考虑物理规律下的人类价值观对齐至关重要 ➢ 在复杂动态环境中不仅要短期安全，还要确保长期行为的安全性，例如对操作环境造成影响。 ➢

10 积分 | 76 页 | 8.39 MB | 10 月前
3

共 3 条前往

页

DeepSeek 模型赋能高校教学科研 2025 山东东大大学山东大学应用部署 R1Kimi 1.5 及类推理推理模型开发解读报告

分类

语言

格式

DeepSeek大模型赋能高校教学和科研2025

山东大学：DeepSeek 应用与部署

2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告