DeepSeek大模型赋能高校教学和科研2025智能体本身既不是单纯的软件也不是硬件 , 而是一个更为 宽泛的概念 , 它们可以是软件程序、 机器人或其他形式的 系统 ,具备一定的自主性和智能性 智能体( AI Agent ) ,又称“人工智能代理” ,是一种模 仿人类智能行为的智能化系统 , 它就像是拥有丰富经验和 知识的“智慧大脑” ,能够感知所处的环境 ,并依据感知 出跨领域的应用潜力 AI Agent 的诞生就是为了处理各种复杂任务的 ,就复杂任务的处 理流程而言 AI Agent 主要分为两大类:行动类、规划执行类。总 而言之 , AI Agent 就是结合大模型能去自动思考、规划、效验和 执行的一个计算体 ,以完成特定的任务目标 ,如果把大模型比作大 脑 ,那 AI Agent 可以理解为小脑 + 手脚 手脚 6. 基于大模型的智能 体 AI Agent 的工作仅需给定一个目标 ,它就 能够针对目标独立思考并做出行动 ,它会 根据给定任务详细拆解出每一步的计划步 骤 ,依靠来自外界的反馈和自主思考 , 自 己给自己创建 prompt ,来实现目标 目前各类 AI Copilot 不再是机械地完成人10 积分 | 123 页 | 15.88 MB | 6 月前3
山东大学:DeepSeek 应用与部署技术创新—模型架构 | V3 PPO : Proximal Policy Optimization GRPO : Group Relative Policy Optimization 强化学习让智能体( Agent )在环境 ( Environment )中不断尝试、学习 ,并优化自己 的策略( Policy ) ,最终获得最大化的奖励 ( Reward )。 DeepSeek : 数据库工 程 RAG 中的 Embedding 模 型 Embedding 模型贯穿 RAG 流程多 环节 Cherry LM+DeepSeek API 大模型智能体工程 五大 AI Agent 多智能体开发框 架 微软 Magentic-One Git hub 地址: https://github.com/micr osoft/autogen/tree/ main/python/packages/autogen-10 积分 | 79 页 | 6.52 MB | 5 月前3
2025年DeepSeek-R1Kimi 1.5及类强推理模型开发解读报告未来更多是能否利用强推理能力赋能Agent和具身智能 ➢ OpenAI Deep Research Agent ➢ Anthropic PC Controller ➢ 需要依赖于强推理模型反思、长程规划、Tool Use 工具调用等能力 ➢ 内存和记忆模块的挑战需要克服,小模型如何获得强推理效果? [1] https://lilianweng.github.io/posts/2023-06-23-agent/ ➢ 与此同时,安全价值的监管具有多元性: 人类的安全价值观具有多样性, 内建价值冲突 \ 单智能体系统下 的安全,并不保证多智能体系统安全 \AI系统伪装已被“安全对齐”,行为欺骗监管 ➢ 随着 VLA \ Agent 等模型下游和赋能应用兴起,确保模型AI系统准确应对不确定性,考虑物理规律下的人 类价值观对齐至关重要 ➢ 在复杂动态环境中不仅要短期安全,还要确保长期行为的安全性,例如对操作环境造成影响。 ➢10 积分 | 76 页 | 8.39 MB | 6 月前3
共 3 条
- 1
