OpenAI的Sora:YouTube训练数据之谜
快速导读:OpenAI的视频AI模型Sora引起了广泛关注,但该公司对于是否使用了YouTube视频来训练该模型仍然守口如瓶。在一次采访中,OpenAI的首席运营官布拉德·莱特卡普讨论了AI技术的潜在商业应用,包括Sora。然而,当被直接问及YouTube的参与时,莱特卡普回避了明确回答。
OpenAI对YouTube角色的含糊回答
在采访中,莱特卡普被要求澄清是否使用了YouTube视频来训练Sora。莱特卡普没有直接回应,而是强调了数据透明性的重要性以及为AI建立内容识别系统的必要性。他提到了创作者选择参与或退出训练和使用的可能性,以及探索将网络内容纳入AI模型的经济机会。尽管问题明确涉及YouTube,但莱特卡普在回答中没有提到它。
OpenAI关于理解在线内容的发布
OpenAI最近发表了一篇关于理解在线内容真实性的文章。然而,这篇文章再次没有涉及使用YouTube视频来训练Sora的问题。相反,它侧重于OpenAI努力建立内容真实性标准和识别使用OpenAI工具创建的内容。这种对于YouTube的提及缺失进一步增加了其在训练Sora中的参与度之谜。
围绕YouTube训练数据的争议
今年早些时候,有报道称OpenAI使用了“超过一百万”小时的YouTube内容来训练GPT-4,违反了该平台的规定。Google在其Gemini项目中据称也采用了类似的做法。尽管有这些报道,OpenAI并未就YouTube在训练Sora中的角色发表明确声明。Sora的发布预计将在今年晚些时候,这让很多人对YouTube的参与程度产生了好奇。原文链接
Tags