YouTube被爆用使用者上传的影片训练Google AI模型

2025年06月21日 1:34

CNBC报导，Google正运用庞大的YouTube影音数据库，训练其人工智能（AI）模型，包括Gemini、及影音和音讯生成工具Veo3，而且许多创作者并不知情。

CNBC报导，Google正运用庞大的YouTube影音数据库，训练其人工智能（AI）模型。（路透）

CNBC报导，Google正运用庞大的YouTube影音数据库，训练其人工智能（AI）模型，包括Gemini、及影音和音讯生成工具Veo3，而且许多创作者并不知情。

知情人士透露，Google正运用超过200亿支YouTube影片，训练这些新时代的AI工具。专家指出，这可能造成和创作者与媒体业者之间的知识产权争议。

Google证实仰赖YouTube训练其AI模型，但表示训练只会用到特定子集的影音，遵循和创作者及媒体公司的特定协议，“我们总是用YouTube内容精进我们的产品，这点在AI出现后并未改变”，“我们也认知有必要设施护栏，因此我们投资强大的保护措施，允许创作者在AI时代保护其影像和作品，这是我们承诺会继续做的事情”。

YouTub去年9月已宣布，将以YouTube内容“改善产品体验…包括透过机器学习与AI应用”，但专家指出，创作者和媒体机构并未广泛理解，Google正运用影音训练训练AI模型，YouTube也未说明在该平台的200亿支影音中，有多少、以及那些被用来训练AI。基于该平台的规模，只用1%训练，就相当于23亿分钟的内容，训练资料比其他竞品AI模型多出40倍。

此外，上传内容到YouTube平台的用户，虽能选择不让自己的内容被亚马逊、苹果及辉达（Nvidia）等特定AI公司用于第三方训练，却没办法选择不让Google用来训练其AI模型。

CNBC指出，在询问多位创作者和知识产权专家后，没人知道、或曾被YouTube通知其内容可能被用于训练Google的AI模型。在Google5月宣布Veo3模型后，YouTube会以用户影音进行训练值得关注。Google在发表Veo3模型时，展现院线片水准的影像序列，整支影片的视觉与音讯全是由AI生成。

为创作者保护数位身份的Loti公司执行长艾瑞冈尼指出，在创作者耗费大量心力制作影音后，Google很可能再从这些影音取得数据，帮助Veo3模型成为这些创作者的“临摹”与“合成”版。

根据YouTube，几乎所有主要媒体业的得利创作者每天平均会上传2,000万支影音到该平台，许多创作者表示，现在担心自己可能在不知情的情况下，帮助训练一个最终可以成为竞争对手、甚至可能取代自己的系统。

即便Veo3的最终成品未直接复制现有作品，这些生成的内容仍可能促成一些商业工具，未来和创作者相竞争，而且都未取得原始创作者同意、未提供补偿、也未标明来源。

帮助个人作品授权、并保护作品免遭滥用的Vermillio公司执行长尼利说，愈来愈多创作者发现各平台都出现自己作品的伪造版，Veo3这类新工具只会加速这个趋势，虽然YouTube有权使用其平台的内容，但许多创作者都不知道自己的影音正被用于训练会生成影音的AI软件。

Vermillio运用自有工具“Trace ID”，评估一支AI生成的影音内容是否与人类创作的影音大幅重叠，以零到100评分，例如一支来自澳洲创作者布罗迪罗斯（Brodie Moss）的影音，与Veo3生成的内容高度符合，影音辨识分数为71分，光是音讯就超过90分。

来源：经济日报

本文标签：中国, 亚马逊, 澳洲, 脸书

热门标签排行