CNBC報導,Google正運用龐大的YouTube影音資料庫,訓練其人工智慧(AI)模型,包括Gemini、及影音和音訊生成工具Veo3,而且許多創作者並不知情。
CNBC報導,Google正運用龐大的YouTube影音資料庫,訓練其人工智慧(AI)模型,包括Gemini、及影音和音訊生成工具Veo3,而且許多創作者並不知情。
知情人士透露,Google正運用超過200億支YouTube影片,訓練這些新時代的AI工具。專家指出,這可能造成和創作者與媒體業者之間的知識產權爭議。
Google證實仰賴YouTube訓練其AI模型,但表示訓練只會用到特定子集的影音,遵循和創作者及媒體公司的特定協議,「我們總是用YouTube內容精進我們的產品,這點在AI出現后並未改變」,「我們也認知有必要設施護欄,因此我們投資強大的保護措施,允許創作者在AI時代保護其影像和作品,這是我們承諾會繼續做的事情」。
YouTub去年9月已宣布,將以YouTube內容「改善產品體驗…包括透過機器學習與AI應用」,但專家指出,創作者和媒體機構並未廣泛理解,Google正運用影音訓練訓練AI模型,YouTube也未說明在該平台的200億支影音中,有多少、以及那些被用來訓練AI。基於該平台的規模,只用1%訓練,就相當於23億分鐘的內容,訓練資料比其他競品AI模型多出40倍。
此外,上傳內容到YouTube平台的用戶,雖能選擇不讓自己的內容被亞馬遜、蘋果及輝達(Nvidia)等特定AI公司用於第三方訓練,卻沒辦法選擇不讓Google用來訓練其AI模型。
CNBC指出,在詢問多位創作者和知識產權專家后,沒人知道、或曾被YouTube通知其內容可能被用於訓練Google的AI模型。在Google5月宣布Veo3模型后,YouTube會以用戶影音進行訓練值得關注。Google在發表Veo3模型時,展現院線片水準的影像序列,整支影片的視覺與音訊全是由AI生成。
為創作者保護數位身份的Loti公司執行長艾瑞岡尼指出,在創作者耗費大量心力製作影音后,Google很可能再從這些影音取得數據,幫助Veo3模型成為這些創作者的「臨摹」與「合成」版。
根據YouTube,幾乎所有主要媒體業的得利創作者每天平均會上傳2,000萬支影音到該平台,許多創作者表示,現在擔心自己可能在不知情的情況下,幫助訓練一個最終可以成為競爭對手、甚至可能取代自己的系統。
即便Veo3的最終成品未直接複製現有作品,這些生成的內容仍可能促成一些商業工具,未來和創作者相競爭,而且都未取得原始創作者同意、未提供補償、也未標明來源。
幫助個人作品授權、並保護作品免遭濫用的Vermillio公司執行長尼利說,愈來愈多創作者發現各平台都出現自己作品的偽造版,Veo3這類新工具只會加速這個趨勢,雖然YouTube有權使用其平台的內容,但許多創作者都不知道自己的影音正被用於訓練會生成影音的AI軟體。
Vermillio運用自有工具「Trace ID」,評估一支AI生成的影音內容是否與人類創作的影音大幅重疊,以零到100評分,例如一支來自澳洲創作者布羅迪羅斯(Brodie Moss)的影音,與Veo3生成的內容高度符合,影音辨識分數為71分,光是音訊就超過90分。
來源:經濟日報