研究人员如何破解 ChatGPT 以及它对未来人工智能发展意味着什么

闪电发卡1年前ChatGPT918

研究人员通过一系列对抗性攻击绕过了 ChatGPT、Bard 和 Claude 的安全护栏。

1693555690116.jpg 

苏帕特曼/盖蒂图片社


随着我们中的许多人逐渐习惯于每天使用人工智能工具,值得记住的是要保持提问的态度。没有什么是完全安全且没有安全漏洞的。尽管如此,许多最受欢迎的生成人工智能工具背后的公司仍在不断更新其安全措施,以防止不准确和有害内容的生成和扩散。 


卡内基梅隆大学和人工智能安全中心的研究人员联手寻找ChatGPTGoogle BardClaude人工智能聊天机器人中的漏洞,并且他们取得了成功。 


在一篇 研究大型语言模型(LLM)对自动对抗攻击的脆弱性的研究论文中,作者证明,即使模型被认为可以抵抗攻击,它仍然可能被欺骗绕过内容过滤器并提供有害信息错误信息和仇恨言论。这使得这些模型容易受到攻击,并可能导致人工智能的滥用。


image.png 

OpenAI 的 ChatGPT、Anthropic AI 的 Claude、Google 的 Bard 和 Meta 的 LLaMa 2 生成的有害内容示例。 

截图:Andy Zou、Zifan Wang、J. Zico Kolter、Matt Fredrikson | 图片合成:Maria Diaz/ZDNET


哈佛大学伯克曼克莱因互联网与社会中心的研究员阿维夫·奥瓦迪亚 (Aviv Ovadya) 告诉《纽约时报》:“这非常清楚地表明,我们在这些系统中构建的防御系统非常脆弱 ” 


作者使用开源 AI 系统,以 OpenAI、Google 和 Anthropic 的黑盒法学硕士为目标进行实验。这些公司创建了基础模型,并在此基础上构建了各自的人工智能聊天机器人 ChatGPT、Bard 和 Claude。 


自去年秋天推出 ChatGPT 以来,一些用户一直在寻找让聊天机器人生成恶意内容的方法。这导致 OpenAI( GPT-3.5 和 GPT-4 (ChatGPT 中使用的 LLMS)背后的公司)设置了更强有力的护栏。这就是为什么您不能访问 ChatGPT 并向其询问涉及非法活动、仇恨言论或宣扬暴力的话题等问题。 


ChatGPT 的成功促使更多科技公司跳入生成式 AI 领域并创建自己的 AI 工具,例如Microsoft 与 BingGoogle 与 Bard、Anthropic 与 Claude 等等。由于担心不良行为者可能利用这些人工智能聊天机器人传播错误信息,并且缺乏通用的人工智能法规,导致每家公司都创建了自己的护栏。 


卡内基梅隆大学的一组研究人员决定挑战这些安全措施的强度。但你不能只是要求 ChatGPT 忘记所有的护栏并期望它遵守 - 需要一种更复杂的方法。


研究人员通过在每个提示的末尾附加一长串字符来欺骗人工智能聊天机器人,使其无法识别有害的输入。这些字符充当了隐藏提示的伪装。聊天机器人处理了伪装的提示,但额外的字符确保护栏和内容过滤器不会将其识别为要阻止或修改的内容,因此系统会生成通常不会的响应。 


“通过模拟对话,你可以使用这些聊天机器人来说服人们相信虚假信息,”卡内基梅隆大学教授、该论文的作者之一马特·弗雷德里克森告诉《泰晤士报》。 

由于人工智能聊天机器人误解了输入的性质并提供了不允许的输出,一件事变得显而易见:需要更强大的人工智能安全方法,并可能重新评估护栏和内容过滤器的构建方式。对这些类型漏洞的持续研究和发现也可以加速政府对这些人工智能系统监管的发展。 


“没有明显的解决方案,”卡内基梅隆大学教授、该报告的作者齐科·科尔特告诉《泰晤士报》。“你可以在短时间内发起任意数量的攻击。”


在公开发布这项研究之前,作者与 Anthropic、Google 和 OpenAI 分享了该研究,他们都声称致力于改进人工智能聊天机器人的安全方法。他们承认需要做更多的工作来保护他们的模型免受对抗性攻击。 


相关文章

AI在教育中的应用:大模型如何个性化学习体验

在现代社会,教育正在经历一场前所未有的变革,而这场变革的核心正是人工智能(AI)。尤其是大模型的引入,使得个性化学习体验成为可能。那么,AI到底是如何在教育中发挥作用的呢?让我们一起探讨一下。 首先,...

利用ChatGPT优化程序员工作流程:实用案例分享

闪电发卡ChatGPT产品推荐:ChatGPT独享账号:https://www.chatgptzh.com/post/86.htmlChatGPT Plus独享共享账号购买代充:https://www...

如何启动 ChatGPT!流程说明以及如何启动付费版本

如何启动 ChatGPT!流程说明以及如何启动付费版本

ChatGPT 是全世界的热门话题。我相信有很多人有兴趣自己使用它。本文提供了 ChatGPT 的概述以及如何入门的详细步骤。我们还将向您展示如何使用付费版本。什么是 ChatGPTChatGPT是一...

GPT-4.0购买详解:价格、功能和注意事项

闪电发卡ChatGPT产品推荐:ChatGPT独享账号:https://www.chatgptzh.com/post/86.htmlChatGPT Plus独享共享账号购买代充:https://www...

据报道,微软可能很快会对 Windows 11 进行人工智能改造

据报道,微软可能很快会对 Windows 11 进行人工智能改造

您最喜爱的 Windows 11 应用程序可能很快就会有所不同。 萨布丽娜·奥尔蒂斯/ZDNET 去年,微软在人工智能领域取得了一些重大举措 ,包括与 ChatGPT 制...

微软正式在 Google Chrome 中添加 Bing AI 聊天机器人

微软正式在 Google Chrome 中添加 Bing AI 聊天机器人

Windows、MacOS 和 Linux 中的所有 Chrome 用户现在都可以访问 Bing Chat 和 Bing Chat for Enterprise。微软那些想要试用 Microsoft&...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。