AutoGPT Star 数破10万,这是首篇系统介绍自主智能体的文章

人工智能可以用来完成非常具体的任务,比如推荐内容、撰写文案、回答问题,甚至生成与现实生活无异的照片。你告诉 AI 完成哪一项任务,它就完成哪一项, 十分简单。


但是,如果你不想帮 AI 把所有这些任务都列出来该怎么办?如果你更想要一个队友而不仅仅是一个工具怎么办?如果你想让人工智能自主思考怎么办?


想象一下,你创造了一个人工智能工具,可以为其设定目标,即使是像「创造世界上最好的冰淇淋」这样模糊的目标,它也会拟出一个待办事项列表,执行待办事项,并根据进展来添加新的待办事项。随后它会继续重复这个过程,直至完成目标。


这正是「自主智能体」所做的事情。在 AI 开发人员的圈子中,它们的成长趋势是最快的,但迄今为止,大多数人并不了解它们。(在写这篇文章的时候,尚无主流出版物写过关于自主智能体的文章。而且自它面世以来,仅有很少数人报道过它,因此,如果你正在读这篇文章…… 那么你就是最早了解到它的人之一了。)


何为自主智能体?为何它们背后隐藏着巨大的机会?它们是如何运行的?它们在未来会是什么样子的?我怎样才能创造或使用它? 


这正是我将为你解答的问题。


何为自主智能体?

自主智能体是由 AI 赋能的程序。当给定一个目标时,它们能够自行创建任务、完成任务、创建新的任务、重新确定任务列表的优先级、完成新的首要任务,并不断重复这个过程,直到完成目标。


请再多读一遍上面的描述,它虽然简单,但却很疯狂。


自主智能体可以被设计用于做任何事情,从管理社交媒体账户、投资市场到制作最好的儿童读物。


「这些是真的吗?现在就能实现吗」


是的,我知道这听起来像科幻小说,但这些都是真实存在的。如果会编码,你可以在几分钟内设计出一个。而这仅仅只是开始。

实现自主智能体所需的编程技术和 AI 是非常现实且极其新颖的。许多开源项目,诸如 AutoGPT、BabyAGI 和 Microsoft 的 Jarvis,在 AI 社区、Github 上都很流行。


在创建开源自主智能体代码库的前两周里,有将近十万名开发人员都在构建自主智能体、优化它们、并寻找它们的能力上限,而这些工作也只是在这些概念被发明的前几周所做的。现今,使用该技术的开发人员数量正在以越来越快的速度飙升。

AI 智能体的成长规模已经超过了长期流行的代码库,如 laravel、bitcoin、django 和 pytorch 等。

 

Auto-GPT Github 受欢迎程度呈指数增长,比历史上任何代码库都快。



这不是科幻小说。许多人认为这些自主智能体才是真正的通用人工智能的开端,又或被称作「AGI」—— 这个术语用于描述已经获得知觉并变得「有生命」的人工智能。


「自主智能体最终可能会将事实性知识的所有应用商品化。如果对事实性知识的获取也变得普遍可用,那么创造力、情感和战略眼光等人类品质将变得更加珍贵、独特。但是,知识也有可能变得越来越专有化,因为个人和公司试图在事实知识的应用商品化、人类集体知识开始停滞的世界中获得经济利益优势。」  —— 前美国联邦调查局新兴技术代理主管、Bondoo AI 联合创始人 Tony Hu


请看一下这个刚刚从 HyperWrite 发布的自主智能体,你可以看到它被安装在了浏览器中,可帮助人们订购比萨。


你只需说「点一份从 Dominos 配送到 One Vanderbilt 的无馅料大披萨」,然后它就可以自己订了。


HyperWrite’s 的自主智能体控制浏览器来订购披萨。



或者,看看斯坦福大学和谷歌合作完成的这个实验,他们创建了一个由 25 个自主智能体组成的虚拟城镇,并告诉其中的一个来组织一场情人节派对。这个例子也许更令人印象深刻。


这些自主智能体模拟的人们过着它们的日子,互相交谈,形成新的记忆,最终它们中的大多数都听说了情人节派对,并且最终出席了。


图源:《Generative Agents: Interactive Simulacra of Human Behavior》


所以自主智能体是真实的…… 这就引出一个疑问:只要告诉智能体目标是什么,然后它就会永远自行管理自己吗?


答案是肯定的。


你只需给它定一个目标,剩下的会由自主智能体自己完成。它就像一个非常好的员工或队友。不过,如果你愿意,也可以自行设计自主智能体,使其在某些关键决策时刻与你联系,以便你可以即时协作指导它们工作。


自主智能体除了能分析目标并分配任务之外,它们还拥有一系列能力,例如:


  • 浏览互联网、会使用应用程序;

  • 长期和短期记忆;

  • 控制你的电脑;

  • 运用 GPT 等大语言模型 (LLM) 进行分析、总结,提出意见并给出答案。


此外,这些自主智能体将具有各种形状和大小。有些将在用户不知道他们在做什么的情况下在幕后运行,而有些则是可见的,如上例所示,用户可以跟踪人工智能的每一个 “想法”。



接下来我们用一个通俗易懂的示例来说明:假设有一个自主智能体可以帮助研究,我们想要关于某个主题的最新新闻总结,比如说关于 Twitter 的新闻:


  • 我们告诉智能体「你的目标是找出有关 Twitter 的最新消息,然后向我发送摘要」;

  • 因此,智能体在看到目标任务后,借助 OpenAI 的 GPT-4 等 AI,从而理解正在阅读的内容,并提出第一个任务,即「任务:在谷歌上搜索与 Twitter 相关的新闻」;

  • 然后智能体在谷歌上搜索 Twitter 新闻,找到热门文章,并返回一个链接列表。第一个任务完成;

  • 继而智能体回顾它的主要目标(找到关于 Twitter 的最新消息,然后发送摘要)以及它刚刚完成的事情(得到一堆关于 Twitter 的新闻链接)并决定它的下一个任务需要是什么 ;

  • 之后,它提出了两个新任务:1)写新闻摘要。2) 阅读通过谷歌找到的新闻链接的内容;

  • 现在智能体在继续工作之前停顿了一会儿,它需要确保这些任务的顺序是正确的。确定应该先写摘要吗?智能体否定了,它决定首要任务是优先阅读通过谷歌找到的新闻链接的内容;

  • 智能体从文章中读取内容,然后再次返回待办事项列表。它想添加一个新任务来总结内容,但该任务已经在待办事项列表中,所以自主智能体并没有添加;

  • 智能体检查待办事项列表,唯一剩下的一项就是总结它阅读的内容,所以它这样做了。此时它就会按照用户要求发送摘要。


下图表展示了自主智能体是如何工作的:


图源:Yojei Nkajima 的 BabyAGI


这一新范式刚刚开始,但它并不完美,还未风靡全球,但这个概念非常强大,并且随着不断的发展和实验,它将很快融入到我们的日常生活。


在更高程度上理解了什么是自主智能体之后,接下来讨论一下为什么自主智能体能够带来如此大的机会?


让我们深入探讨下吧。


为何自主智能体能带来如此大的机会


很明显,很快你不仅可以选择雇用人类作为员工,而且还可以以自主智能体的形式雇用 AI。



而且它们不会像雇佣人类一样昂贵,它们不会睡觉、不会辞职,而且会非常高效地工作。



这些自主智能体将存在于每个行业并可运用在每项可以想象的任务中。下图展示的只是少数几个例子:


该列表可以不断加长。人可以做的事情,自主智能体将(最终,但很快,而且在某些情况下已经)能够做得更好。



该如何抓住机会呢?有两个非常现实的机会。


自己创建自主智能体并让它们可供其他人雇用;


聘请自主智能体,它们现在可以协助提高你的个人生活质量或业务工作效率。

想象这样一个世界,其中一个人建立了一家公司,其团队中只有自主智能体。在你的一生中,你很可能会看到一个人的团队能够做到这一点并实现超过 10 亿美元的市值,而这通常需要非常多的人一起工作才能完成。

现在,在早期阶段,先行者们无论是制造自主智能体还是使用它们,都将在与尚未利用这些系统的竞争者中取得巨大优势。

通过阅读这篇文章,你将早已领先于世界 99% 的人。让我们深入探索一下更多关于这些自主智能体如何工作的细节吧。

自主智能体是如何工作的

你已经大致了解了自主智能体的工作原理,但我认为给你提供一个整体框架版本并逐步分解几个自主智能体示例会很有帮助。



以下是一个自主智能体的通用框架:


  • 初始化目标:定义 AI 的目标;

  • 任务创建:AI 检查其记忆中最近完成的 X 个任务(如果有),然后使用它的目标和最近完成的任务的环境来生成新任务列表;

  • 任务执行:AI 自主执行任务;

  • 内存存储:任务和执行结果存储在矢量数据库中;

  • 反馈收集:AI 以外部数据或 AI 内部对话的形式收集对已完成任务的反馈。此反馈结果将用于通知自适应过程循环的下一次迭代;

  • 新任务生成:人工智能根据收集到的反馈和内部对话生成新任务;

  • 任务优先级:人工智能通过审查目标并查看最后完成的任务来重新确定任务列表的优先级;

  • 任务选择:AI 从优先列表中选择最靠前的任务,然后按照步骤 3 中的描述继续执行它们;

  • 迭代:AI 在连续循环中重复步骤 4 到 8,使系统能够根据新信息、反馈和不断变化的需求进行调整。


Octane AI 工程总监 Gabriel Menezes 表示:「自主智能体真的让我着迷,因为它们体现了终极生产力助推器的属性。作为一个高度重视单调工作或重复性任务自动化的人,我发现这些智能体有可能彻底改变我们的工作方式,使我们能够将我们的精神能量转向更有意义的追求。」


示例展示


示例 1:社交媒体管理器自主智能体


假设你不想聘请社交媒体经理来管理你的社交媒体帐户,而是希望自主智能体以极低的成本和全天候的智能为你做所有事情。


下面是自主智能体框架可能的样子:


  • 初始化目标:设置初始参数,例如目标受众、社交媒体平台、内容类别和发布频率;

  • 数据收集:收集有关过去社交媒体帖子、用户互动和平台特定趋势的数据。这可能包括点赞、分享、评论和其他参与度指标;

  • 内容分析:分析收集到的数据,以确定与目标受众相关的模式、热门话题、主题标签和影响者。此步骤可能涉及自然语言处理和机器学习技术,以理解内容及其上下文;

  • 内容创建:根据分析,生成内容创意并创建适合平台和受众偏好的社交媒体帖子。这可能涉及使用 AI 生成文本、图像或视频,以及合并用户生成的内容或来自其他来源的精选内容;

  • 日程规划:根据平台具体的趋势、受众活动和所需频率确定发布每条内容的最佳时间。相应地安排帖子;

  • 性能监控:根据参与度指标(例如点赞、分享、评论和点击率)跟踪每个帖子的表现。如果可能,收集用户反馈以进一步完善对受众偏好的理解;

  • 迭代和改进:分析性能数据和用户反馈以确定需要改进的地方。更新内容策略、创建和计划流程以纳入这些见解。反复执行步骤 2-7 以不断完善社交媒体管理系统并随着时间的推移提高其有效性。

通过将这种循环型系统纳入社交媒体管理,你可以创建一个动态的自适应策略,随着受众的偏好和不断变化的社交媒体环境而演进。这将有助于提高社交媒体工作的参与度、影响力和整体有效性。

示例 2:能够竞选职位的自主智能体


如果你正在竞选一个职位并且想利用 AI 助手来获得帮助。


  • 初始目标:通过确保大多数选票赢得选举;

  • 数据收集:收集有关选民、人口统计、关键问题、竞选信息和其他相关信息的数据;

  • <li style="outline-style: initial; outline-width: 0px; max-width: 100%; font-size: 15px; letter-spacing: normal; overflow-wrap: break-word !i

    Keyword: Pika