OpenAI 表示,它正在采取“深思熟虑的方式”发布能够检测 ChatGPT 书写的工具

OpenAI 已经开发了一款工具,可以抓住那些通过使用 ChatGPT 代写作业而作弊的学生——但据《华尔街日报》报道,该公司正在讨论是否真正发布该工具。

OpenAI 发言人在向 TechCrunch 提供的声明中证实,该公司正在研究《华尔街日报》报道中描述的文本水印方法,但表示由于“所涉及的复杂性及其可能对 OpenAI 以外的更广泛生态系统产生的影响”,因此采取了“慎重的方式”。

该发言人表示:“我们正在开发的文本水印方法在技术上很有前景,但在研究替代方案时,我们也在权衡其中的重大风险,包括容易被不良行为者规避,以及可能对非英语人士等群体造成不成比例的影响。”

这与之前大多数检测 AI 生成文本的努力不同,因为这些努力基本上是无效的。甚至 OpenAI 自己也在去年关闭了之前的 AI 文本检测器,原因是其“准确率低”。

借助文本水印,OpenAI 将专注于检测 ChatGPT 中的文字,而不是其他公司模型中的文字。它通过对 ChatGPT 选择单词的方式进行细微更改来实现这一点,本质上是在文字中创建一个不可见的水印,之后可以通过单独的工具检测到。

在《华尔街日报》发表该报道后,OpenAI 还更新了5 月份的一篇博客文章,介绍其检测 AI 生成内容的研究。更新称,文本水印已被证明“高度准确,甚至对局部篡改(如释义)有效”,但已被证明“对全局篡改的鲁棒性较差;例如使用翻译系统、用另一个生成模型改写,或要求模型在每个单词之间插入一个特殊字符,然后删除该字符。”

因此,OpenAI 写道,这种方法“很容易被坏人规避”。OpenAI 的更新也呼应了发言人关于非英语人士的观点,他写道,文本水印可能会“使非英语母语人士将人工智能作为有用的写作工具的做法蒙羞”。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注