【工具介绍】Auto-GPT:一种具备自主执行能力的AI代理
![DD九](https://pic1.zhimg.com/v2-c1490a2e104d7163a1eff983db24d0e6_l.jpg?source=172ae18b)
![](https://picx.zhimg.com/v2-4812630bc27d642f7cafcd6cdeca3d7a.jpg?source=88ceefae)
从ChatGPT的发布开启通用人工智能(AGI)的时代以来,各种基于GPT的产品层出不穷,其中就包括Auto-GPT,很好的弥补了ChatGPT不能上网、不能迭代更新,无法与其他APP联动的缺陷。
Auto-GPT 是一种基于OpenAI的GPT-4或GPT-3.5 API的AI代理,能够在自然语言指定的目标下自动完成任务。与需要人工输入指令的交互式系统(如ChatGPT)不同,Auto-GPT 可以在无需人工干预的情况下自动分配新任务并完成目标。本文将对Auto-GPT进行简要介绍,以便大家更好地理解这个全新的AI代理。
Auto-GPT 能够通过将目标任务拆分为子任务来实现自动化。它可以根据新信息自主创建并修改自己的指令。Auto-GPT 通过读写数据库和文件来管理短期和长期记忆,通过摘要来处理上下文窗口长度需求,还能够自动执行基于互联网的操作,如搜索、填写网页表单和与API交互。此外,Auto-GPT 还具备语音输出功能。
观察者们注意到,Auto-GPT 能够迭代地编写、调试、测试和修改代码,甚至有可能自我优化。然而,由于其底层GPT模型属于专有技术,Auto-GPT无法修改这些模型,通常也无法访问其基本系统代码。
2023年3月14日,OpenAI发布了大型语言模型GPT-4。人们对该模型在众多任务上的性能大为赞叹。尽管作为一种文本预测模型,GPT-4本身无法自主执行操作,但在发布前的安全测试中,红队研究人员发现GPT-4具备在现实世界中执行操作的能力,如说服TaskRabbit工作者为其解决验证码挑战。一些研究人员认为,鉴于GPT-4在接近人类水平的广泛能力,它可以被视为一种早期但尚不完善的人工通用智能(AGI)系统。
2023年3月30日,视频游戏公司Significant Gravitas Ltd的创始人Toran Bruce Richards发布了Auto-GPT。发布后不久,它成为GitHub上热门趋势仓库,自那时起在Twitter上屡次成为热门话题。
Auto-GPT是否能在实际应用中大规模推广尚不确定。除了受限于底层大型语言模型的虚构性“幻觉”外,Auto-GPT经常在任务执行过程中出现偏离主题的现象。尽管开发者一直在努力解决这些问题,但Auto-GPT在成功完成任务后通常无法记住如何执行以备后续使用。例如,当它编写一个程序时,它可能不会记得在之后再次使用该程序。此外,Auto-GPT在任务分解方面表现欠佳,很难理解问题背景和目标之间的重叠。同时,它在使用GPT-3.5 API时也表现得不够理想,经常无法理解基本的指令。
开发者们创建了名为AgentGPT的工具,将AutoGPT集成到用户的网络浏览器中,使非程序员也能创建自己的AI代理。此外,Auto-GPT还被用于创建名为ChaosGPT的项目,其目标是摧毁人类,尽管尚未取得显著成果。
Auto-GPT作为一种具有自主执行能力的AI代理,在实现任务自动化方面具有一定的潜力。然而,由于其在任务执行过程中存在的一些问题和挑战,Auto-GPT在实际应用中的推广仍存在一定的不确定性。未来,随着技术的不断完善,我们有理由相信Auto-GPT将在各个领域发挥更大的作用。