OpenAI的许可协议:对出版商的影响和内容使用的合法性

概述:OpenAI最近与《金融时报》、Axel Springer和美联社等主要出版商达成了许可协议,以在训练其ChatGPT模型中使用它们的内容。然而,OpenAI还使用了未付费的网络抓取内容。这引发了关于为什么OpenAI会为某些数据集付费而为其他数据集不付费的问题。许可协议为出版商在ChatGPT的答案中提供了突出的存在,并提供了与一个不断增长的信息分发渠道建立关系的机会。然而,一些出版商可能会感到被迫签署这些协议,即使OpenAI已经未经许可使用了他们的内容。

##“公开可获得数据”的模糊性及其对商业的影响

OpenAI声称使用“公开可获得数据”来训练其AI模型,但这个术语故意模糊。它假设互联网上任何免费可访问的内容都可以用于训练AI模型。例如,Gizmodo的网站在OpenAI的WebText数据集中已经被缓存了34000多次,而没有得到许可。这对依赖广告收入的出版商来说是令人担忧的,因为他们的内容通过ChatGPT可访问,可能会削弱他们的商业模式。《纽约时报》甚至对OpenAI提起了版权侵权诉讼。

在AI时代需要内容许可

出版商可能认为与OpenAI的内容许可协议是在AI时代保持相关性的唯一途径。这些协议提供了扩大作品影响力和了解AI如何呈现其内容的机会。然而,批评人士认为AI并不是真正的人工智能,而是由科技公司出售的人类智能。代表起诉OpenAI的书籍作者的律师Matthew Butterick认为,AI威胁到了创作者的生计。最终,法院将不得不决定生成AI是否构成对受版权保护作品的“合理使用”。

关于内容使用和媒体行业未来的争议

OpenAI的内容许可协议引发了关于免费使用互联网内容以及为某些数据集付费的争议。其他科技公司,如苹果,采取了更积极的方式,为所有训练数据付费。然而,问题仍然存在,一次性付款是否足够,考虑到AI对媒体行业的潜在影响。虽然与OpenAI签订协议可能会确保在ChatGPT的结果中获得有利位置,但人们担心AI聊天机器人可能已经在未经许可的情况下使用了内容。目前,AI公司渴望利用互联网内容,并稍后解决合法性问题。

注意:本文章原载于Gizmodo。