开放AI在Sora AI的训练数据透明度上的不足引发关注

Sora训练数据的来源不明确

在一次采访中,开放AI的首席技术官米拉·穆拉蒂在Sora AI的训练数据方面提供具体细节时遇到了困难。穆拉蒂提到使用了公开可用和授权的数据,但无法确认是否包括来自YouTube、Instagram或Facebook等热门平台的视频。穆拉蒂回答的不清晰和含糊引发了对开放AI的数据获取实践和他们处理版权问题的担忧。

反应不一和透明度的需求

对穆拉蒂模糊回答的反应在网上各异,有些人批评她对Sora的训练数据了解不足或不够透明。其他人则为开放AI辩护,认为如果内容是公开可用的,AI公司就可以使用。然而,这一事件凸显了互联网的新现实,即用户的内容可以被价值数十亿美元的AI公司在没有明确同意的情况下使用。未来,开放AI和其他公司需要提供更多的透明度,并解决有关训练数据的获取和使用的担忧。