扩展 ChatGPT:AI 聊天机器人插件真的能改变游戏规则吗?
我深入研究了 ChatGPT 和其他人工智能聊天机器人插件的真正强大之处。它们真的能改变你的工作生活吗?它们值得吗?请继续阅读。
Jaap Arriens/NurPhoto/Getty Images
插件长期以来一直是复杂软件系统的固定装置。早在 20 世纪 80 年代,我就创立了一家名为 Hyperpress 的公司,为 Apple 的 HyperCard 提供插件(可以将其视为 Web 之前的网络……或连接)。我的插件向 HyperCard 添加了原始构建中不包含的功能。
如今,插件增强了 Photoshop 和 WordPress 等流行产品的功能。WordPress 提供了大约 60,000 个可修改其功能的插件。
在我运营的两个主要网站上,我在一个网站上使用 49 个独立的插件(添加了大约 49 个新功能) ,在另一个网站上使用了 25 个插件(添加了大约 25 个新功能)。如果没有大量增加功能和价值的插件,这些网站都不会成为复杂的专业电子商务网站。
什么是插件?
从根本上来说,插件是与父软件平台交互的独立代码块。他们通过 API(应用程序编程接口)来完成此操作。所有支持插件的平台都提供 API,允许外部程序员接入平台的功能。
通常,API 的广度和可靠性决定了整个平台的弹性和灵活性,尤其是当用户依赖大量插件来扩展他们所使用的插件支持平台的功能时。
如果做得好,插件将使三个方面受益:平台提供商(即 Adobe for Photoshop、开源 WordPress 社区和 OpenAI for ChatGPT)、插件开发者以及获得新功能的平台用户。
平台提供商经常决定与开发商竞争。如果他们发现某个插件特别受欢迎,他们有时会选择将该功能包含在核心产品中。他们改变API。有时,如果他们提供市场(如应用程序商店,但提供插件),他们会选择性地允许谁进入市场以及推广谁。
但是,当平台提供商和插件开发人员之间的舞蹈发挥作用时,看起来很神奇。原始平台可以出现在没有人预料到的地方,提供原本不可能实现的功能。
谷歌的 Bard、微软的 Bing AI 和 ChatGPT 已经宣布了插件功能。然而,到目前为止,只有 ChatGPT 提供了大量可以实际使用的插件。
插件目前在 ChatGPT 中的工作方式
ChatGPT 插件仅适用于 ChatGPT Plus 的付费客户。这是一项每月 20 美元的服务,提供对 GPT-4 数据集、插件和一个名为“高级数据分析”的特殊插件的访问(稍后会详细介绍)。
David Gewirtz/ZDNET 截图
每月花 20 美元,你就可以使用一个非常测试版、非常未完成的产品。这仍然令人惊奇,但也很烦人。三小时内只能进行 25 个查询,因此如果您想完成工作,很可能会在工作时间中用完所有查询。是的,我的发言来自非常沮丧的经历。您还需要在“设置”中将它们打开。
David Gewirtz/ZDNET 截图
现在您已经启用了插件,准备好留下深刻的印象吧。
改变现状的插件
我尝试了很多插件。因为您一次只能使用三个插件,所以您确实需要挑选一个您经常使用的核心插件库。这是我列出的列表,为我将要向您展示的示例提供支持:
·故事:这会根据提示生成一本故事书。我只使用过一次(因为我没有孩子),但它是如此令人印象深刻,这是你需要看到的东西。
·MixerBox WebSearchG:这使得当前的整个网络都可供 ChatGPT 使用,并且做得非常好。这真正扩展了 ChatGPT 的价值。
·世界新闻:扫描新闻来源并提供最新的新闻摘要。
·AskYourPDF:您可以向 ChatGPT 提供 PDF 并与 PDF 文档中的数据进行交互。
·高级数据分析:这是 OpenAI 提供的特殊附加组件/插件。如果运行此插件,则无法运行任何其他插件。它允许您使用代码与 ChatGPT 对话,但它也可以解释复杂的请求并大大扩展您可以询问 ChatGPT 的查询。
请注意,我不会提供每个插件的 URL。ChatGPT 插件商店不为每个插件提供唯一的 URL。但它们很容易找到。只需前往 ChatGPT 插件商店并搜索其标题即可。如果您想了解如何启用插件并访问插件商店,ZDNET 的 Steven Vaughan-Nichols 有一个很棒的教程。
这个插件是作家罢工的原因
让我们从故事开始。在上一篇文章中,我向您展示了如何让 ChatGPT 编写一个简短的《星际迷航》故事(以及它如何取得大部分成功)。故事将这个想法变成现实。
在 ChatGPT 中,您可以向故事提供提示,描述您想要讲述的故事。这是我喂它的东西:
使用故事,讲述一群生活在星际飞船上的朋友的故事(三个是人类,一个是机器人)。讲述他们前往一个有感知恐龙居住的星球的冒险之旅,在那里,有感知恐龙的创造力是非法的,所有的故事、娱乐、音乐等都是由生成人工智能系统创作的。
然后,故事会根据这个前提生成一本完整的故事书。虽然生成的图形有点弱(它们可以受益于中途质量技术),但整体制作相当不错。我给这个插件一个涉及一些道德选择的前提,人工智能不仅想出了一个很好的小故事,而且还讲了一个连在一起的故事。
David Gewirtz/ZDNET 截图
但故事更进一步。您可以以数字形式在线阅读这个故事。或者您可以访问故事网站并订购精装本。您甚至可以在亚马逊上发布这个故事。
你可以看到这种事情如何让专业创意人员,尤其是那些目前正在罢工的创意人员感到恐惧。不到五分钟,我就得到了一本完全可用的故事书。这本 50 页的故事书(每页都有一个段落)采用传统方式编写和插图,可能需要数周或数月的时间。
我只是喝了一口咖啡,根据典型的《星际迷航》主题大致设定了一个前提,然后将其输入人工智能。
当 ChatGPT 可以读取网页时
众所周知,ChatGPT 的知识库将于 2021 年结束。但通过 MixerBox WebSearchG 插件,我们可以体验到当 AI 可以阅读网络时会发生什么。当我知道自己正在触及未来时,这也产生了一种“哇”的感觉。
2023 年 7 月 10 日,我发表了一篇 ZDNET 文章,介绍了我在使用 Google Cloud 存储企业计划时遇到的挑战。在那篇文章中,我创造了“次震”一词,并在文章的两个结论段落中提到了它。
然后,7 月 11 日,我向 ChatGPT 询问了这个问题:
Gewirtz 如何定义“次震”
我没有告诉 ChatGPT 是哪个 Gewirtz,也没有告诉它 ZDNET 上发表了一篇文章。然而,它对新创造的词“次震”背后的意图进行了非常清晰(而且我可以补充说,准确)的描述。
David Gewirtz/ZDNET 截图
显然,ChatGPT 现在可以使用该插件访问当前数据并对其进行处理以了解其含义。
您还可以在下一个示例中看到 ChatGPT 保留上下文的能力如何与插件访问网络的能力相结合。我问它:
告诉我关于 David Gewirtz 的狗 Pixel 的事
它不仅提取了信息,还显示了这个小家伙的照片,并链接到我写的关于选择他的名字的文章。
David Gewirtz/ZDNET 截图
了解时事
在开发这个特殊功能时,我发现了三个“杀手级应用程序”,我将在工作中定期使用它们。让我们先讨论第一个:创建简报,用完整的背景信息解释当前新闻。
在我的工作中,我跟踪很多新闻。客户经常要求我提供有关科技新闻、技术趋势和一些地缘政治问题的观点。这意味着我每天花几个小时来跟上我的阅读,确保我很好地理解正在发生的事情。
但我不可能跟上所有的事情,而且我也不能真正花很多时间来处理那些不属于我的主要“节奏”的主题。即便如此,我还是想对这些问题有一个深入的了解。
乌克兰/俄罗斯战争就是一个例子。虽然我已经写过这些攻击如何影响乌克兰开发商,甚至涵盖了近十年前的乌克兰安全问题,但我还没有“充分了解”乌克兰申请成为北约成员国的问题。
我本可以翻阅一堆新闻文章并进行背景研究,但我真的没有时间分配给它。相反,我要求 ChatGPT、MixerBox WebSearchG 和 World News 为我准备一份全面的简报。我问了两个问题:
您是一名美国政策顾问,向首席执行官通报北约局势。你被要求解释为什么拜登总统说乌克兰还没有准备好加入北约。使用 World News 和 MixerBox WebSearchG 为争论双方提供清晰的简报,以便您的客户对问题、复杂性和政治影响有深入和最新的了解。将你的答案也与美国的政治气候联系起来。
和
使用相同的插件,共和党是否对乌克兰加入北约持反对意见?
从这两个问题中,AI向我全面介绍了北约成员身份问题、成员身份背后的基础问题和政治问题以及双方在此问题上的立场。
我妻子订阅了一项名为Blinkist 的服务。该公司将其服务描述为“Blinkist 以专为移动设备打造的形式提供顶级非小说类作品的关键见解”。它本质上是当前流行的非小说类书籍的可听或可读的克里夫笔记,它可以让她在大约半小时内快速了解她关心的主题。
通过将 ChatGPT 与 MixerBox WebSearchG 和世界新闻相结合,我基本上可以获得有关当前正在展开的任何世界新闻问题的 Blinkest“关键见解”简报。这是很强大的东西,但与所有媒体报道一样,重要的是要意识到人工智能向您呈现的内容可能存在偏见、遗漏和不准确。
使用 PDF 作为分析源材料
我最近有一个分析项目,我必须翻阅又长又干的白皮书,试图理解一些关键技术之间的关系。使用 AskYourPDF 插件,我将这些 PDF 提供给 ChatGPT,然后提出与 PDF 内容相关的问题。
这是非凡的。我能够要求 ChatGPT 分析 PDF 中包含的各种概念。我什至可以让它绘制一个表格来比较 PDF 中讨论的项目,但这些项目尚未在源文档中直接进行比较。
我永远不会使用 ChatGPT 来代替阅读我负责调查的项目的所有背景信息。但我为自己的学习过程所做的大部分分析都需要大量非常繁琐的文书工作来构建表格和图表,以增加我对文档内关系的理解。
我还用它来检查一些合同。我向它提供了我们与服务提供商签订的合同文件,并要求它向我展示双方之间的限制有何不同,通常提取和确定这些限制非常耗时。这是我使用的提示:
创建一个表格来比较限制,逐项列出列出的每个限制。仅显示双方之间的限制不同的地方,用 8 个或更少的单词总结每个不同的限制
这是我拿回来的表格:
David Gewirtz/ZDNET 截图
当然,毫无疑问,ChatGPT 的结果不能完全准确。但快速扫描绝对可以节省时间。
使用 ChatGPT 和 AskYourPDF,通常需要半天或更长时间的文书研究任务被减少到仅仅几分钟。这是一个杀手级应用程序。
进行大规模数据分析
最后,我想探索一个来自 OpenAI 的独立运行的 ChatGPT 插件。它被称为高级数据分析,它的作用不仅仅是解释代码。高级数据分析允许您将数据上传到其中,然后 ChatGPT 可以分析这些数据。
警告:如果您当天还有其他事情要做,请勿首次使用此功能。你会被吸引的。它比小猫和小狗的视频对生产力更具破坏性。
问我怎么知道的。我的意思是,很难相信如此有趣的事情真的是合法的。
该工具允许您将数据文件(Excel、CSV 等)导入 ChatGPT。然后它可以对其进行分析,甚至生成基本图形。它很容易让人上瘾。开始工作几个小时后,我发现自己从data.gov上下载了一个又一个的数据集,并对触手可及的力量狂笑不已。这景象并不美好。
我认为这最终就是 ChatGPT Plus 限制每三小时 25 次查询的原因。这并不是为了减少其基础设施的负载。这是为了我们自己好。我确实需要它。如果不是查询限制迫使我离开计算机,我可能不会整天吃东西。
我将在《大卫之心》中为您省去更多令人不安的分析愿景,而是向您展示一个简单的应用程序:我的电子邮件联系人、我经常与哪些大型公关公司通信以及哪些大型科技公司最具代表性。为此,我从 Google 通讯录导出了我的联系人。
使用电子邮件相关字段,列出代表的前 20 个域名
与公关公司相关的前 20 个域名中
David Gewirtz/ZDNET 截图
然后,我列出了人工智能列表,并绘制了一个饼图,其中列出了我接触最多的科技公司。这是我问的:
查看数据集,创建一个饼图,显示价值数十亿美元的大型科技公司的相对代表性
这就是我得到的结果。
David Gewirtz/ZDNET 截图
饼图的格式并不理想,但信息就在那里。再说一次,我们谈论的是几分钟而不是几小时。
但是...我们仍处于早期阶段
插件可用,但它们非常新。有些,就像我上面演示的那样,具有很大的优势。但由于它们太新了,它们也有很多缺点和烦恼:
·ChatGPT 插件商店中有近 700 个插件。大多数都是未经策划的(几乎任何事情都会发生)。
·虽然您可以搜索关键字,但它们是未分类的。 像 Pluginpedia 和 PlugFinder 这样的插件声称可以帮助解决这个问题,但它们并不那么可靠。
·许多插件都是......这个词是什么?嗯。有些人只是访问提供商的网站。例如,有一个用于获取折扣券的插件。这比 RetailMeNot 好在哪里?
·许多插件似乎都是 为了尽早在新市场中站稳脚跟而进行品牌推广或公关活动。例如,有一个特定硅谷小型初创公司首席执行官的“AI 克隆”插件。据说,你可以问任何你想知道的关于他的事情。嗯是的。这并不是我们大多数人可能会使用的东西。
·许多插件不起作用或作用不大。 我试图让当地的食品配送插件告诉我在我的城镇哪里可以吃到牛排晚餐,它推荐了 Subway。是的,他们有牛排三明治,但我本可以从 Yelp 上得到更好的结果。我还发现了一堆插件只是简单地挂起而没有任何结果。
·您一次只能运行三个插件, 如果您想更换插件集,则必须在 ChatGPT 中启动新的聊天会话,从而丢失所有当前的讨论历史记录。这是一个很大的限制。但即使只有三个插件,您也看到了我如何让插件界面来做一些神奇的事情。
ChatGPT for Dummies的作者 Pam Baker表示 ,“鉴于 3 个插件/25 个查询的上限以及某些当前插件的价值值得怀疑,现在很难看到其中的魔力。但是这些上限是必要的,这样 OpenAI 才能更好地管理模型稳定性并加强护栏,因为它吸收了更多的能力。”
公平地说,我们还很早。这就是为什么我不分享那些不合格的插件的名称。随着时间的推移,他们很有可能会变得更好。
那么,插件真的能改变游戏吗?
是的。他们是这样。他们确实这么做了。我们还处于早期阶段,我必须花额外的时间来挑选四个我认为我会一直使用的功能(加上故事,它显示了生成人工智能潜力的额外水平)。
我发现如果我将 MixerBox WebSearch G、World News 和 AskYouTPDF 组合起来作为我的主要三个插件集,我可以做很多事情。如果我想做更深入的数据分析项目,我可以切换到高级数据分析。请注意,我发现 WebSearch G 有点不可靠。如果遇到问题,请将其关闭并尝试使用 WebPilot 插件。
随着 ChatGPT 处理插件的能力不断增强,随着插件发现和管理变得更好,随着我们可以同时使用越来越多的插件,很明显,我们在 2023 年才认识的那种聊天机器人将会迎来一个新的时代。一系列未来的升级,为我们的任务和项目提供越来越多的帮助。
ChatGPT for Dummies作者 Baker 分享了她对插件未来的看法。她说:“插件添加的功能最终将使我们能够动态修改 ChatGPT。” 她的前提是 ChatGPT(以及其他法学硕士)将能够发展自己的能力。
她告诉 ZDNET,“瞬间,ChatGPT 将能够变成适合任何任务的完美工具。最终,ChatGPT 将能够自动确定并选择响应每个提示所需的插件。如果它需要的插件不存在,那么 ChatGPT 将能够自动确定并选择它需要的插件。尚不存在,它将即时创建并无缝吸收新功能。”
此时,我无法判断我们是在创建天网还是博格。无论哪种方式,享受插件提供的附加功能......而......你......仍然......可以。
抵抗是徒劳的。