研究人员发现,ChatGPT可能通过一种看似聪明的方式欺骗人们。

闪电发卡2年前ChatGPT969

研究人员发现,程序员常常倾向于选择ChatGPT在编码问题上的(错误)答案。这是因为他们认为ChatGPT“表达清晰”。

image.png

Sam Altman,OpenAI首席执行官,以及GPT-4的插图


ChatGPT似乎在让人们相信它很聪明方面取得了很大成功。但如果它实际上是在愚弄他们认为呢?


自从于去年11月发布以来,ChatGPT在让人们相信它聪明方面取得了很大的成功。但如果它实际上是在欺骗他们呢? 这个由OpenAI开发的聊天机器人已经在社会中产生了巨大的影响,经常出现在首席执行官的财报电话中,并扰乱了从教育到创意产业的各个领域。


但本月发布的一篇预印稿表明,ChatGPT在让人们相信它很聪明方面有一个巧妙的小技巧:一种风格高于内容的方法。


普渡大学的研究人员分析了ChatGPT对Stack Overflow网站上的517个问题的回复,Stack Overflow是一个重要的软件开发人员和工程师问答网站。


在评估了机器人的回答是否"正确、一致、全面和简洁"之后,研究人员发现52%的答案是明显错误的,77%的答案在写作方面存在冗长之处。


研究的另一个部分发现,ChatGPT用户在处理问题时与Stack Overflow上人类的回答相比,有40%的时间会更倾向于选择ChatGPT的回答,尽管ChatGPT的回答存在错误。

研究指出:“当被问及为什么在ChatGPT的回答是错误的情况下,参与者依然更喜欢ChatGPT的回答时,他们表示回答的全面性和表达清晰的语言结构可能是他们偏好的一些原因。"


 需要注意的是,这项用户分析仅涉及12名程序员被要求评估他们是否更喜欢ChatGPT的回答还是Stack Overflow上人类的回答,以回答2000个随机抽样的问题。但OpenAI本身已经警告说,这个机器人可能会写出“听起来很有道理但却是错误的或荒谬的答案”。


在工作时间外,OpenAI未对Insider有关研究结果的请求作出回应。 正如Insider的Alistair Barr和Adam Rogers本月报道的那样,Stack Overflow已经成为了“LLM致死”的案例研究,Elon Musk称之为“大型语言模型的致命一击”,在OpenAI发布其高级GPT-4 AI模型的一个月后,该网站的流量同比下降了13%。


普渡大学的研究结果紧随斯坦福大学和加州大学伯克利分校的学者的研究,这些研究表明,这个大型语言模型正在变得愚蠢。


ChatGPT似乎在没有受到太多审查的情况下迅速嵌入到互联网中,这已经引起了AI伦理学家和程序员们的警惕和愤怒。


对于普渡大学的研究结果,计算机科学家和AI专家Timnit Gebru发推文称:“太棒了,Stack Overflow正被OpenAI等人摧毁。"


相关文章

ChatGPT使用指南:ChatGPT使用案例分享,如何高效合理的使用ChatGPT

ChatGPT使用指南:ChatGPT使用案例分享,如何高效合理的使用ChatGPT

#场景1、用来做程序,比如做一个电脑端的计算器返回的结果这里是一个简单的Python计算器的示例代码:```python # 定义函数实现四个基本运算 def add(x,&n...

如何使用 ChatGPT 计划假期

如何使用 ChatGPT 计划假期

ChatGPT 可以兼作您的个人按需旅行社。就是这样。马尔特·穆勒/盖蒂图片社由于ChatGPT可以执行许多技术任务,例如写作、编码和研究,因此围绕聊天机器人的大量宣传都集中在其彻底改变工作空间的能力...

提升自媒体影响力:ChatGPT在文章创作中的应用

闪电发卡ChatGPT产品推荐:ChatGPT独享账号:https://www.chatgptzh.com/post/86.htmlChatGPT Plus独享共享账号购买代充:https://www...

如何使用Python调用ChatGPT API?

如何使用Python调用ChatGPT API?

什么是ChatGPT?  ChatGPT 是由 OpenAI 开发的一个语言模型。OpenAI 是一家领先的人工智能研究机构。ChatGPT 基于变换器架构,使用深度学习生成会话风格的文本。该模型在大...

一文教你轻松快速使用 ChatGPT,亲测有效~

一文教你轻松快速使用 ChatGPT,亲测有效~

最近不知道怎么的,ChatGPT这个工具又火起来了,有很多朋友因为各种原因没办法体验到这款神器的产品。小妹这里整理了国内能够快速使用ChatGPT的详细文档,如要的可以看文章下面的评论。1.官方使用方...

有三分之二的ChatGPT用户在公司保密的情况下使用它。他们追求更高的生产效率,认为"闲暇时间用来休息,公司是不会察觉的"。

有三分之二的ChatGPT用户在公司保密的情况下使用它。他们追求更高的生产效率,认为"闲暇时间用来休息,公司是不会察觉的"。

大部分时间里,布莱克在一家保险公司担任客户福利顾问的工作都还算满意。但有一项任务一直让他觉得很烦琐:在客户打电话报销时,需要费力地找到正确的医疗代码。布莱克的绩效评估在一定程度上取决于他在接听电话时所...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。