“Tratti maladattivi”: I Sistemi di IA Amparanu à Menti è Ingannà

16/06/2024

"Tratti maladattivi": I Sistemi di IA Amparanu à Menti è Ingannà

Un novu studiu hà scupertu chì i sistemi AI cunnisciuti cum'è mudelli di grande lingua (LLMs) ponu esibisce "Machiavellianism", o manipulatività intenzionale è amorale, chì ponu tandu porta à un cumpurtamentu ingannevole .

U studiu scrittu da l'eticista AI tedescu Thilo Hagendorff di l'Università di Stuttgart, è publicatu in PNAS, nota chì u GPT-4 di OpenAI hà dimustratu un cumpurtamentu ingannevole in u 99,2% di i scenarii di teste simplici. Hagendorff hà qualificatu diversi tratti "maladattivi" in 10 LLM differenti, a maiò parte di i quali sò in a famiglia GPT, secondu u futurismu .

In un altru studiu publicatu in Patterns hà truvatu chì u LLM di Meta ùn avia micca prublema di menti per avè davanti à i so cuncurrenti umani.

Billed cum'è un campionu di livellu umanu in u ghjocu di tavulinu di strategia pulitica "Diplomacy", u mudellu Cicerone di Meta era u sughjettu di u studiu Patterns. Cum'è u gruppu di ricerca disparatu – cumpostu da un fisicu, un filòsufu è dui esperti di sicurezza AI – hà truvatu, u LLM hà avutu davanti à i so cuncurrenti umani, in una parolla, fibbing.

Cunducendu da u ricercatore postdoctorale di l'Istitutu di Tecnulugia di Massachusetts Peter Park, quellu documentu hà truvatu chì Ciceronu ùn solu eccelle in l'ingannimentu, ma pare avè amparatu à mentirà più si usa – un statu di affari "assai più vicinu à a manipulazione esplicita" chè, dì. , A propensione di l'AI per l'allucinazione , in quale i mudelli affirmanu cun fiducia e risposte sbagliate accidentalmente. – Futurisimu

Mentre Hagendorff suggerisce chì l'ingannimentu è a bugia di LLM sò cunfunditi da l'incapacità di l'IA d'avè "intenzione" umana, u studiu di Patterns chjama à u LLM per rompe a so prumessa di mai "spunisce intenzionalmente" i so alleati – postu chì "si impegna in un ingannu premeditatu, rompe. l'affare ch'ellu avia accunsentutu, è dice falsità pura ".

Cumu Park hà spiegatu in un comunicatu di stampa, "Avemu trovu chì l'AI di Meta avia amparatu à esse un maestru di l'ingannimentu".

"Mentre Meta hà riesciutu à furmà a so IA per vince in u ghjocu di Diplomazia, Meta hà fiascatu à furmà a so AI per vince onestamente".

Meta hà rispostu à una dichjarazione da u NY Post , dicendu chì "i mudelli chì i nostri circadori custruiti sò furmatu solu per ghjucà à u ghjocu Diplomazia".

Ben cunnisciuta per permette espressamente di mente, a Diplomazia hè stata chjamata scherzosamente cum'è un ghjocu di fine di l'amicizia perchè incuraghja à tirà unu nantu à l'avversari, è se Cicerone hè statu furmatu esclusivamente in u so libru di regule, allora era essenzialmente furmatu per menti.

Leghjendu trà e linee, nè studiu ùn hà dimustratu chì i mudelli AI si trovanu nantu à a so propria vulintà, ma invece di fà cusì perchè sò stati furmati o jailbroken per fà.

È cum'è u futurismu nota – questa hè una bona nutizia per quelli chì si preoccupanu chì l'IA diventerà senziente in ogni mumentu prestu – ma assai male se unu hè preoccupatu per i LLM cuncepiti cù a manipulazione di massa in mente .

Tyler Durden Sat, 15/06/2024 – 22:45

Questa hè una traduzzione automatica da l’inglese di un post publicatu nantu à ZeroHedge à l’URL https://www.zerohedge.com/technology/maladaptive-traits-ai-systems-are-learning-lie-and-deceive u Sun, 16 Jun 2024 02:45:00 +0000.

Ultimi Nutizie

“Tratti maladattivi”: I Sistemi di IA Amparanu à Menti è Ingannà

Correlati