AI 智能体是使用 AI 来实现目标并代表用户完成任务的软件系统。其表现出了推理、规划和记忆能力,并且具有一定的自主性,能够自主学习、适应和做出决定。
这些功能在很大程度上得益于生成式 AI 和 AI 基础模型的多模态功能。AI 智能体可以同时处理文本、语音、视频、音频、代码等多模态信息;可以进行对话、推理、学习和决策。它们可以随着时间的推移不断学习,并简化事务和业务流程。智能体可以与其他智能体协作,来协调和执行更复杂的工作流。
如上所述,虽然 AI 智能体的主要功能是推理和执行(如 ReAct Framework 中所述),但随着时间的推移,更多功能也随之发展起来。
AI 助理是作为应用或产品而设计的 AI 智能体,可通过理解和响应自然人类语言和输入内容,与用户直接协作并执行任务。其可以在用户的监督下进行推理并代表用户采取行动。
AI 助理通常嵌入在所使用的产品中。一个关键特征是,助理和用户在任务的不同步骤中进行互动。助理会响应用户的请求或提示,且可以推荐操作,但决策由用户做出。
AI 智能体 | AI 助理 | 聊天机器人 | |
用途 | 自主、主动地执行任务 | 协助用户执行任务 | 自动执行简单任务或对话 |
功能 | 可以执行复杂的多步骤操作;学习和适应;可以独立做出决策 | 响应请求或提示;提供信息并完成简单任务;可以推荐操作,但决策由用户做出 | 遵循预定义的规则;有限的学习能力;基本互动 |
交互 | 主动;以目标为导向 | 被动;响应用户请求 | 被动;响应触发器或命令 |
AI 智能体
AI 助理
聊天机器人
用途
自主、主动地执行任务
协助用户执行任务
自动执行简单任务或对话
功能
可以执行复杂的多步骤操作;学习和适应;可以独立做出决策
响应请求或提示;提供信息并完成简单任务;可以推荐操作,但决策由用户做出
遵循预定义的规则;有限的学习能力;基本互动
交互
主动;以目标为导向
被动;响应用户请求
被动;响应触发器或命令
每个智能体都定义了角色、个性和沟通风格,包括具体指令和可用工具的说明。
可以根据 AI 智能体的功能、角色和环境,以多种方式对其进行分类。以下是一些主要的智能体类别:
智能体类型和智能体类别具有不同的定义。
一种对智能体进行分类的方法是根据它们与用户的互动方式。有些智能体会直接与用户对话,而有些智能体则在后台运行,无需用户直接输入即可执行任务:
AI 代理可以通过工具和体现来提供自主性、任务自动化以及与现实世界互动的能力,从而增强语言模型的能力。
提高产量:代理会像专业工人一样分工协作,从而提高整体工作效率。
同时执行:代理可以同时处理不同的事务,而不会相互干扰。
自动化:代理可处理重复性任务,让人类有更多时间从事更具创造性的工作。
协作:客服人员一起工作、辩论想法并相互学习,从而做出更好的决策。
适应能力:客服人员可以根据情况的变化调整其计划和策略。
强大的推理能力:通过讨论和反馈,客服人员可以优化推理过程并避免出错。
解决复杂问题:代理可以结合各自的优势来解决具有挑战性的现实问题。
自然语言沟通:代理可以理解和使用人类语言与用户和其他代理进行交互。
工具使用:代理可以使用工具和获取信息来与外部世界互动。
学习和自我提升:代理会从经验中学习,并随着时间的推移变得更出色。
逼真模拟:代理可以模拟类似人类的社交行为,例如建立关系和分享信息。
涌现行为:复杂的社会互动可以从个体代理的互动中自然产生。
虽然 AI 代理带来了诸多好处,但在使用过程中也存在一些挑战:
需要深度同理心/情商或需要复杂的人际互动和社会动态的任务 - AI 代理在处理细微的人性情感方面可能力不从心。治疗、社会工作或冲突解决等任务需要一定程度的情感理解和共情,而 AI 目前还不具备这些能力。它们可能在需要理解隐晦暗示的复杂社交场合中表现不佳。
具有较高道德风险的情况 – AI 代理可以根据数据做出决策,但它们缺乏在道德复杂情境中所需的道德准则和判断力。这包括执法、医疗保健(诊断和治疗)和司法决策等领域。
具有不可预测的物理环境的领域 – 在实时适应性和复杂的运动技能至关重要的不可预测的高度动态物理环境中,AI 代理可能难以胜任。这包括手术、某些类型的建筑工作和灾难应对等任务。
资源密集型应用 - 开发和部署复杂的 AI 代理可能需要大量的计算资源和普通资源,这可能使其不适合较小的项目或预算有限的组织。
组织一直在部署智能体来解决各种应用场景,我们将这些应用场景归为以下六个主要类别:
客户服务智能体
客户服务智能体将通过了解客户需求、答疑、解决客户问题或推荐合适的产品和服务来提供个性化的客户体验。 它们可跨多个渠道(包括网站、移动设备或销售终端)无缝工作,并可与支持语音或视频的产品体验相结合。
员工服务智能体
员工服务智能体可通过简化流程、管理重复性任务、回答员工问题以及编辑和翻译关键内容和通信内容来提高工作效率。
创意服务智能体
创意服务智能体可以生成内容、图像和创意,协助设计、撰写、个性化和制作广告系列,从而为设计和创意过程注入强劲动力。
数据服务智能体
数据代理是为复杂的数据分析而构建的。它们能够发掘数据中的有意义的洞见并据此做出响应,同时可确保其结果的事实完整性。
代码服务智能体
代码服务智能体可利用依托 AI 技术的代码生成和编码辅助功能来加速软件开发,并快速上手使用新的语言和代码库。许多组织都看到了生产效率的显著提升,这使得部署速度更快,代码更简洁、更清晰。
安全服务智能体
安全服务智能体可以通过缓解攻击或加快调查速度来改善安全状况。它们可以监督安全生命周期的各个阶段(预防、检测和响应)和各个方面。
Google Cloud 在 AI 代理领域提供一系列产品和解决方案。这些工具包括集成式 AI 助理、预构建的 AI 代理、AI 应用,以及用于构建自定义 AI 代理的代理和开发者工具平台。