YouTube被爆用使用者上传的影片 训练Google AI模型
CNBC报导,Google正运用庞大的YouTube影音数据库,训练其人工智能(AI)模型,包括Gemini、及影音和音讯生成工具Veo3,而且许多创作者并不知情。
CNBC报导,Google正运用庞大的YouTube影音数据库,训练其人工智能(AI)模型。(路透)
CNBC报导,Google正运用庞大的YouTube影音数据库,训练其人工智能(AI)模型,包括Gemini、及影音和音讯生成工具Veo3,而且许多创作者并不知情。
知情人士透露,Google正运用超过200亿支YouTube影片,训练这些新时代的AI工具。专家指出,这可能造成和创作者与媒体业者之间的知识产权争议。
Google证实仰赖YouTube训练其AI模型,但表示训练只会用到特定子集的影音,遵循和创作者及媒体公司的特定协议,“我们总是用YouTube内容精进我们的产品,这点在AI出现后并未改变”,“我们也认知有必要设施护栏,因此我们投资强大的保护措施,允许创作者在AI时代保护其影像和作品,这是我们承诺会继续做的事情”。
YouTub去年9月已宣布,将以YouTube内容“改善产品体验…包括透过机器学习与AI应用”,但专家指出,创作者和媒体机构并未广泛理解,Google正运用影音训练训练AI模型,YouTube也未说明在该平台的200亿支影音中,有多少、以及那些被用来训练AI。基于该平台的规模,只用1%训练,就相当于23亿分钟的内容,训练资料比其他竞品AI模型多出40倍。
此外,上传内容到YouTube平台的用户,虽能选择不让自己的内容被亚马逊、苹果及辉达(Nvidia)等特定AI公司用于第三方训练,却没办法选择不让Google用来训练其AI模型。
CNBC指出,在询问多位创作者和知识产权专家后,没人知道、或曾被YouTube通知其内容可能被用于训练Google的AI模型。在Google5月宣布Veo3模型后,YouTube会以用户影音进行训练值得关注。Google在发表Veo3模型时,展现院线片水准的影像序列,整支影片的视觉与音讯全是由AI生成。
为创作者保护数位身份的Loti公司执行长艾瑞冈尼指出,在创作者耗费大量心力制作影音后,Google很可能再从这些影音取得数据,帮助Veo3模型成为这些创作者的“临摹”与“合成”版。
根据YouTube,几乎所有主要媒体业的得利创作者每天平均会上传2,000万支影音到该平台,许多创作者表示,现在担心自己可能在不知情的情况下,帮助训练一个最终可以成为竞争对手、甚至可能取代自己的系统。
即便Veo3的最终成品未直接复制现有作品,这些生成的内容仍可能促成一些商业工具,未来和创作者相竞争,而且都未取得原始创作者同意、未提供补偿、也未标明来源。
帮助个人作品授权、并保护作品免遭滥用的Vermillio公司执行长尼利说,愈来愈多创作者发现各平台都出现自己作品的伪造版,Veo3这类新工具只会加速这个趋势,虽然YouTube有权使用其平台的内容,但许多创作者都不知道自己的影音正被用于训练会生成影音的AI软件。
Vermillio运用自有工具“Trace ID”,评估一支AI生成的影音内容是否与人类创作的影音大幅重叠,以零到100评分,例如一支来自澳洲创作者布罗迪罗斯(Brodie Moss)的影音,与Veo3生成的内容高度符合,影音辨识分数为71分,光是音讯就超过90分。
来源:经济日报