【工具介绍】Auto-GPT：一种具备自主执行能力的AI代理

DD九

会做游戏，会调教AI，会写故事

从ChatGPT的发布开启通用人工智能（AGI）的时代以来，各种基于GPT的产品层出不穷，其中就包括Auto-GPT，很好的弥补了ChatGPT不能上网、不能迭代更新，无法与其他APP联动的缺陷。

Auto-GPT 是一种基于OpenAI的GPT-4或GPT-3.5 API的AI代理，能够在自然语言指定的目标下自动完成任务。与需要人工输入指令的交互式系统（如ChatGPT）不同，Auto-GPT 可以在无需人工干预的情况下自动分配新任务并完成目标。本文将对Auto-GPT进行简要介绍，以便大家更好地理解这个全新的AI代理。

Auto-GPT 能够通过将目标任务拆分为子任务来实现自动化。它可以根据新信息自主创建并修改自己的指令。Auto-GPT 通过读写数据库和文件来管理短期和长期记忆，通过摘要来处理上下文窗口长度需求，还能够自动执行基于互联网的操作，如搜索、填写网页表单和与API交互。此外，Auto-GPT 还具备语音输出功能。

观察者们注意到，Auto-GPT 能够迭代地编写、调试、测试和修改代码，甚至有可能自我优化。然而，由于其底层GPT模型属于专有技术，Auto-GPT无法修改这些模型，通常也无法访问其基本系统代码。

2023年3月14日，OpenAI发布了大型语言模型GPT-4。人们对该模型在众多任务上的性能大为赞叹。尽管作为一种文本预测模型，GPT-4本身无法自主执行操作，但在发布前的安全测试中，红队研究人员发现GPT-4具备在现实世界中执行操作的能力，如说服TaskRabbit工作者为其解决验证码挑战。一些研究人员认为，鉴于GPT-4在接近人类水平的广泛能力，它可以被视为一种早期但尚不完善的人工通用智能（AGI）系统。

2023年3月30日，视频游戏公司Significant Gravitas Ltd的创始人Toran Bruce Richards发布了Auto-GPT。发布后不久，它成为GitHub上热门趋势仓库，自那时起在Twitter上屡次成为热门话题。

Auto-GPT是否能在实际应用中大规模推广尚不确定。除了受限于底层大型语言模型的虚构性“幻觉”外，Auto-GPT经常在任务执行过程中出现偏离主题的现象。尽管开发者一直在努力解决这些问题，但Auto-GPT在成功完成任务后通常无法记住如何执行以备后续使用。例如，当它编写一个程序时，它可能不会记得在之后再次使用该程序。此外，Auto-GPT在任务分解方面表现欠佳，很难理解问题背景和目标之间的重叠。同时，它在使用GPT-3.5 API时也表现得不够理想，经常无法理解基本的指令。

开发者们创建了名为AgentGPT的工具，将AutoGPT集成到用户的网络浏览器中，使非程序员也能创建自己的AI代理。此外，Auto-GPT还被用于创建名为ChaosGPT的项目，其目标是摧毁人类，尽管尚未取得显著成果。

Auto-GPT作为一种具有自主执行能力的AI代理，在实现任务自动化方面具有一定的潜力。然而，由于其在任务执行过程中存在的一些问题和挑战，Auto-GPT在实际应用中的推广仍存在一定的不确定性。未来，随着技术的不断完善，我们有理由相信Auto-GPT将在各个领域发挥更大的作用。

发布于 2023-04-26 11:36 ・IP 属地湖南

GPT

人工智能

AutoGPT