用这个方法,释放生成式AI解决问题的潜力

Posted by 活水智能 on May 28, 2024 · 1 min read

作者:Ravi Sawhney

编译:活水智能

来源:LSE Business Review

2021年,我发表了一篇文章,展示了OpenAI的GPT-3在将人类语言转换为代码方面的强大能力。

当时,这项技术还处于初期阶段,并没有像2022年11月公开发布的ChatGPT那样引起轰动——真正点燃了生成式人工智能(GenAI)的热潮。

(译者著:生成式人工智能(GenAI)是一种通过学习和模仿大量数据,生成新内容(如文本、图像、音频、视频、3D模型等)的人工智能技术,国内常称为AIGC)

本文我将讨论为何GenAI如此重要以及在工作中使用它的挑战。同时,我也介绍了多代理工作流(multi-agent workflows)这一方法,以提高我们的生产力。

一切都是为了生产力

2024年,几乎所有的企业软件公司都在押注生成式人工智能,可能因此掩盖了现有机器学习方法(如监督学习和无监督学习)的光芒,这些方法仍然是任何完整AI框架的重要组成部分。

组织之所以这样做,归根结底还是为了提高生产力,这是我最初对这项技术感兴趣的原因。

从最基本的形式来看,GenAI可以被视为我们见过的最强大的自动补全技术。大型语言模型(LLM)的预测下一个词的能力非常出色,可以承担知识工作者的任务,如分类、编辑、总结、问答以及内容创建。

此外,这项技术的变体可以跨模态操作,就像人类的感官一样,包括语音和视觉的解释和生成。事实上,到2024年,术语已经从LLM转变为大型多模态模型(LMM),最近发布的OpenAI的GPT-4o便是一个例子。

无论是以建议的形式,有人类在环中的过程,还是完全自动化的决策,GenAI都有潜力为知识工作领域的劳动生产力带来变革性的提升。

最近的一份报告估计,通过推动任务自动化,GenAI每年可以将劳动生产力提高3.3个百分点,为全球GDP创造4.4万亿美元的价值。

这种生产力的提升或许让我们更接近凯恩斯在1930年写的《我们子孙的经济可能性》中所描述的愿景,他预测在一百年后,技术进步将提高生活水平,我们每周的工作时间可以减少到15小时。

这一观点也得到了诺贝尔经济学奖得主克里斯托弗·皮萨里德斯的呼应,他表示ChatGPT可能预示着每周四天工作制的到来。

因此,如果变革工作方式的潜力就在眼前并且正在迅速发展,我们该如何弥合这一可能性与现实之间的差距呢?

信任与工具

在将这项技术整合到最终用户的工作场所技术中时,需要考虑两个典型的挑战。

最大的挑战可能是管理信任问题。默认情况下,LLM无法访问你的私人信息,因此询问它关于你自己产品的非常具体的支持问题时,通常会得到一个自信但不准确的回答,这通常被称为“幻觉”。

在你自己的数据上微调LLM是一个选项,但考虑到硬件需求,这是一项昂贵的工作。更为可行的方法是社区中普遍采用的检索增强生成(RAG)。这是一种通过使用嵌入技术,将你的私人数据带入查询提示中以进行查找的方法。

这种生成的响应是从这些数据和LLM的现有知识中综合得来的,尽管需要一些适当的用户指导,但可以认为是有用的。

第二个挑战是数学能力。尽管通过一些精心设计的提示,LLM可以从头开始创建一个独特的、引人注目的、(重要的是)令人信服的故事,但在处理基础到中等数学问题时,它可能会遇到困难,具体情况取决于你使用的基础模型。

在这里,社区引入了工具或代理的概念。在这种范式下,LLM可以对查询进行分类,而不是尝试回答它,而是调用适合工作的工具。

例如,如果被问及外面的天气,它可能会调用天气API服务。如果被要求进行数学计算,它会将查询路由到计算器API。

而如果需要从数据库中检索信息,它可能会将请求转换为SQL或Pandas,在沙箱环境中执行生成的代码并将结果返回给用户,而用户可能完全不知道背后发生了什么。

多代理工作流的潜力

具有工具的代理框架正在扩展LLM解决现实问题的可能性。然而,由于记忆、规划和推理能力的限制,它们仍然无法执行复杂的知识工作任务。

多代理框架为解决这些挑战提供了机会。

理解它们如何工作的一种好方法是与丹尼尔·卡尼曼所推广的系统1和系统2思维进行对比。

系统1思维可以视为你的直觉:快速、自动和直观。在LLM的世界中,这类似于模型基于其庞大的训练数据生成类似人类的响应的能力。相反,系统2思维较慢、更深思熟虑、更具逻辑性,代表了模型进行结构化、逐步解决问题和推理的能力。

要充分释放LLM的潜力,我们需要开发利用系统1和系统2能力的技术。通过将复杂任务分解为更小、更易管理的步骤,我们可以引导LLM执行更结构化和可靠的解决问题,类似于人类解决挑战的方式。

考虑一个由多个代理组成的团队,每个代理通过提示工程被分配一个特定的角色,共同完成一个目标。这实际上就是代理工作流的本质,有时也称为代理化工作流。

每个代理负责特定的子任务,并相互沟通,传递信息和结果,直到整个任务完成。通过设计鼓励逻辑推理、逐步解决问题和与其他代理协作的提示,我们可以创建一个模拟系统2所关联的深思熟虑和理性思维的系统。

这令人兴奋之处在于:代理工作流可以让我们模拟整个团队工作。想象一下,一个由AI代理组成的虚拟团队,每个代理都有自己的专业领域,共同解决问题并做出决策,就像人类团队一样。

这可以彻底改变我们的工作方式,使我们能够在零或最少人类干预的情况下应对更复杂的挑战。

这也开启了在沙箱环境中模拟团队对事件反应的可能性,每个团队成员都被建模为工作流中的一个代理。这些对话输出甚至可以保存以供以后检索,作为长期记忆。

通过结合系统1思维的原始力量和系统2的结构化推理,我们可以创建不仅能生成类似人类响应,还能处理更复杂任务并逐步解决问题的AI系统。

工作的未来已经到来,它是由人类智慧和人工智能的共生关系推动的。


• 作者免责声明:所有表达的观点仅为个人观点。

推荐阅读

50+开源仓库!让你在本地轻松运行大模

最全盘点:人类历史上所有文本数据总量

八款产品首次亮相!总有一款适合你