Reddit 起诉 Anthropic 未经授权使用其数据训练其模型
发布时间:2025-06-05 19:09 浏览量:3
有些人一直在说预训练的时代已经结束,但似乎对大量互联网文本进行培训仍然非常有价值。
在线讨论平台 Reddit 起诉 Anthropic 未经授权使用其数据来训练其模型。Anthropic 制作了流行的 Claude 系列模型,这些模型在编码任务中特别受欢迎。“Anthropic 实际上是故意对 Reddit 用户的个人数据进行训练的,而从未征求过他们的同意,”Reddit 声称,并补充说 Anthropic 的行为与它“自称是人工智能行业的白衣骑士”的方式背道而驰。
Reddit 已与 OpenAI 和谷歌达成数据使用协议,但尚未与 Anthropic 达成协议。Reddit 表示,它发现 Anthropic 的机器人在两家公司未能达成类似协议后仍访问其网站。“我们相信开放的互联网。这并不意味着开放利用,”Reddit 的首席法务官 Ben Lee 说。
Reddit 是互联网上最受欢迎的论坛之一,其成员匿名参与各种主题的讨论。这意味着 Reddit 的大量问题和答案语料库——以及这些答案的评级——对于希望培训其 LLM 的 AI 公司来说非常有价值。在公司设立护栏之前,公司已经抓取 Reddit 的数据有一段时间了,并要求与那些想要访问其数据的人达成财务协议。
不过,Anthropic 表示,该公司不同意 Reddit 的说法,并将积极为自己辩护。在过去的几年里,Anthropic 在构建 AI 产品以最大限度地降低 AI 快速发展的负面影响的风险时,以深思熟虑和保守而著称。关于非法使用数据的诉讼无助于这种声誉,Anthropic 可能会在法庭上打官司,以洗清其非法使用数据训练其模型的罪名。