Ultimi Nutizie

Attualità mundiale per u populu corsu

Rivista Principià

L’intelligenza artificiale hè corta di dati?

L'intelligenza artificiale hè corta di dati?

U cunsensu per l'usu di dati per furmà l'AI pare esse in crisa. Se certi editori è e plataforme in linea bluccanu cumpagnie cum'è OpenAI, Anthropic è Google, altri facenu u so materiale dispunibule per una tarifa. Ma questu hà ancu implicazioni negativi. Fatti è cumenti

I dati chì alimentanu l'intelligenza artificiale (AI) sò in esaurisce. Questu hè secondu a nova ricerca da a Data Provenance Initiative , un gruppu di ricerca guidatu da u MIT, chì hà rilevatu un drasticu calamentu di u cuntenutu dispunibule per a furmazione AI. In fatti, assai fonti web anu cuminciatu à limità l'usu di e so dati, attivendu i paywalls o bluccà cumpagnie cum'è OpenAI, Anthropic è Google.

A CRISI DI CONSENTU

"Avemu vistu un rapidu calatu in l'accettazione di l'usu di dati in u web, chì avarà ramificazioni micca solu per l'imprese AI, ma ancu per i circadori, accademichi è entità non cummirciali", disse Shayne Longpre, autore principale di u studiu.

U studiu , chì hà esaminatu 14 000 domini web, hà nutatu chì l'editori è e plataforme in linea anu pigliatu misure per impediscenu a cullizzioni di e so dati. In particulare, studiendu i dati di furmazione AI cumunimenti utilizati, i circadori stimanu chì u 5% di tutti i dati – è u 25% di e dati da e fonti di più alta qualità – sò stati ristretti, stabilitu per mezu di u protocolu di exclusione di robot.

PER È CONTRA

I dati sò l'alimentu di l'IA è a più alta qualità hè, megliu i risultati chì ponu generà. Mentre per anni i sviluppatori sò stati capaci di cullà dati abbastanza facilmente, l'accelerazione chì hè accaduta in l'ultimi dui anni hà pruvucatu diverse reazzioni trà i pruprietarii di dati.

L'editori è e plataforme in ligna sò spartuti trà quelli chì anu accettatu cumprumessi cù e case di software cum'è OpenAI per dà u so materiale è quelli chì ricusanu di fà per creà paywalls o mudificà i so termini di serviziu.

Trà quelli chì anu firmatu accordi ecunomichi per furnisce e dati utili per a furmazione AI sò, per esempiu, The Associated Press, News Corp è più ricenti The Atlantic , mentri u New York Times hà lanciatu una battaglia legale contru Microsoft per a violazione di u copyright.

IMPLICAZIONI E DILEMI

Pagamentu di dati, soprattuttu s'ellu hè sottumessu à i diritti d'autore, hè una dumanda sacrosanta ma cum'è Yacine Jernite, un ricercatore di machine learning in Hugging Face, una cumpagnia chì furnisce arnesi è dati à i sviluppatori di IA, hà osservatu, se tutti i dati riguardanti l'If. A furmazione di l'AI anu da esse ottenuta per l'accordi di licenza, questu escluderà "i ricercatori è a sucità civile da participà à a guvernanza di a tecnulugia".

"Ùn hè micca surprisa chì i creatori di dati anu reagitu dopu chì i testi, l'imaghjini è i video chì anu spartutu in ligna sò stati utilizati per sviluppà schemi cummirciali chì volte minaccianu direttamente a so sussistenza", aghjunse .

Questu hè ripresu da Stella Biderman, direttore esecutivu di EleutherAI, una urganizazione di ricerca AI senza prufittu: "E grande cumpagnie tecnologiche pussede digià tutte e dati. Cambià a so licenza ùn revoca retroattivamente quella autorizazione è l'impattu principale hè nantu à quelli chì ghjunghjenu dopu, chì sò generalmente picculi start-up o circadori ".

L'IMPORTANZA DI CONTROLLÀ AI

Per Longpre, sò dunque necessarii novi strumenti chì permettenu à i pruprietari di u situ web per cuntrullà megliu l'usu di e so dati. Inoltre, in un mondu ideale, alcuni di questi puderianu esse dispunibuli à l'urganisazioni senza prufittu o istituzioni educative è denegati à Big Tech invece.

Ma in più di i prublemi di dati, l'implicazioni di l'IA è a rapidità cù a quale hè in evoluzione necessitanu un cuntrollu strettu di sta tecnulugia chì rischia di sdrughje in mani sbagliate. Basta à dì chì un rapportu recente da a Fundazione Internet Watch (IWF) dichjara chì a quantità di materiale di abusu sessuale di i zitelli generata da intelligenza artificiale è publicata in linea hè in crescita.

In una rivista di 30 ghjorni sta primavera di un foru web scuru utilizatu per sparte tali materiale, l'IWF hà truvatu un totale di 3 512 imaghjini è video creati da AI, a maiò parte di elli realistichi. U numaru d'imaghjini hà aumentatu da 17% paragunatu à u numeru d'imaghjini truvati in una rivista simili realizata in a caduta di u 2023.

A rivista di cuntenutu hà ancu truvatu chì una proporzione più grande di materiale publicatu nantu à u web scuru avà rapprisenta atti sessuale più estremi o espliciti chè sei mesi fà.


Questa hè una traduzzione automatica da a lingua italiana di un post publicatu in StartMag à l’URL https://www.startmag.it/innovazione/lintelligenza-artificiale-e-a-corto-di-dati/ u Sun, 28 Jul 2024 14:15:20 +0000.