O nouă licență pentru AI: dezvoltatorii vor putea plăti pentru conținutul folosit la antrenarea modelelor

O organizație non-profit din Marea Britanie, Copyright Licensing Agency (CLA), vrea să lanseze, în a doua jumătate a anului 2025, o Licență de Antrenare pentru AI Generativă. Scopul este să permită dezvoltatorilor de modele lingvistice mari (LLM) să folosească legal materiale protejate în schimbul unei plăți către editorii și autorii care dețin drepturile.

Această licență ar veni în sprijinul creatorilor care nu au resursele sau influența necesare pentru a negocia direct cu marile companii tech. În același timp, oferă și claritate legală pentru dezvoltatorii AI, indiferent că sunt startupuri sau giganți globali.

CLA colaborează pentru acest proiect cu două organizații britanice importante din zona drepturilor de autor, Publishers’ Licensing Services și Authors’ Licensing and Collecting Society (ALCS).

„Folosirea conținutului protejat pentru antrenarea AI necesită acord și compensație financiară. Prin această licență colectivă, vrem să arătăm că există o cale de mijloc, una legală și eficientă, care sprijină atât inovația, cât și respectarea drepturilor creatorilor”, a declarat Mat Pfleger, CEO-ul CLA.

Totuși, provocarea e una serioasă, pentru că industria tech nu e tocmai cunoscută pentru răbdare când vine vorba de respectarea regulilor. De cele mai multe ori, companiile inovează rapid, și abia apoi se ocupă de aspectele legale.

Un exemplu recent: OpenAI, evaluată la 300 miliarde de dolari, a transmis autorităților americane că ar trebui să poată folosi orice tip de date pentru a-și antrena modelele și că alte țări nu ar trebui să îi impună restricții de copyright.

În Marea Britanie, guvernul a încheiat de curând o consultare publică pe tema AI și a propus excepții de la drepturile de autor pentru activități de tip text and data mining (TDM), adică procesarea automată a unor volume mari de texte și date.

„O excepție TDM care să permită rezervarea drepturilor, combinată cu mai multă transparență, ar putea fi o soluție bună atât pentru creatori, cât și pentru dezvoltatorii AI”, spune guvernul britanic.

Această abordare este susținută și de think tank-ul Tony Blair Institute for Global Change, finanțat de Oracle.

Totul e distractiv când generăm imagini în stil Studio Ghibli cu ChatGPT, dar în realitate, drepturile de autor sunt o chestiune serioasă.

Boții AI nu țin cont de reguli precum robots.txt, iar comunitatea IETF încearcă acum să îmbunătățească aceste standarde de protecție.

În plus, mai rămâne problema datelor deja folosite fără acord. De exemplu, dataset-ul Books3, care conține aproape 200.000 de cărți în format text, este acuzat că ar fi încălcat drepturile de autor „la scară absolut masivă”, potrivit Asociației Editorilor din Marea Britanie.

Totodată, publicația The Atlantic a dezvăluit că Meta și alți dezvoltatori de AI ar fi accesat milioane de cărți și articole științifice prin platforma LibGen, lucru care a dus la procese în SUA.

Și OpenAI este bănuit că a folosit conținut protejat fără permisiune. Mai mulți autori britanici au fost șocați să descopere că operele lor se află în aceste baze de date folosite pentru antrenarea inteligenței artificiale.

Citește și

spot_img

Alte știri din aceeași rubrică

spot_img