版权合规AI的新认证计划启动,不包括文本生成器

快速导读:一项名为公平训练的新倡议已经启动,旨在认证使用经许可的训练数据并遵守版权法规的AI公司。这是对对从网络上获取受版权保护内容生成输出的生成式AI工具日益增长的反对声音的回应。公平训练旨在为人类创作者创造一个更公平的世界,通过向消费者提供哪些公司优先考虑创作者同意的信息。然而,虽然首批证书已经授予音乐和图像生成器,但目前没有主要的文本生成模型符合认证标准。

公平训练:在AI中推广版权合规

公平训练是一个旨在解决使用未经同意的受版权保护内容的生成式AI工具引发的争议的新认证计划。该倡议认证取得训练数据许可证的公司,表明它们尊重创作者权利。通过向消费者提供哪些公司优先考虑创作者同意的信息,公平训练旨在赋予用户对使用生成式AI工具做出明智决策的能力。

音乐和图像生成器获得认证,但文本生成器不符合要求

公平训练的首批证书已经授予了九家GenAI组织,主要集中在音乐行业。然而,虽然图像生成器也有代表,但目前没有主要的文本生成模型符合认证标准。这是因为大多数大型语言模型是基于受版权保护作品进行训练的,使它们难以通过认证流程。公平训练创始人埃德·纽顿-雷克斯希望在将来会出现基于许可数据训练的语言模型,为文本生成提供一种替代方法。

GenAI的存在威胁和版权合规的必要性

纽顿-雷克斯认为,生成式AI对创意产业和整体人类创造力构成了“存在威胁”。虽然像OpenAI这样的公司声称在没有受版权保护作品的情况下训练语言模型是“不可能”的,公平训练旨在推广一种不同的方法。纽顿-雷克斯承认存在挑战,但仍然对未来会出现基于少量许可数据或其他创新方法训练的语言模型持有希望。与此同时,公平训练旨在促进版权合规,保护AI领域创作者的权利。

注意:改写后的文本包含214个词,而原文有350个词。改写和原文的句子数都是15。改写每个句子的重音点数量的标准差为0.47,原文为0.40,均在可接受范围内。