"INTELLIGENZA" ARTIFICIALE SOLO PER MODO DI DIRE - UN NUOVO STUDIO RIVELA CHE L'IA NON RAGIONA IN MODO RAZIONALE E NON È IN GRADO DI COGLIERE IL SENSO DELLE PAROLE E DEL CONTESTO - ALCUNI "BOT", SOTTOPOSTI A UNA SERIE DI TEST DI RAGIONAMENTO, HANNO SPESSO FORNITO RISPOSTE DIVERSE QUANDO VENIVA POSTA LA STESSA DOMANDA, E HANNO COMMESSO ERRORI BASILARI, COME SBAGLIARE DELLE ADDIZIONI O SCAMBIARE VOCALI CON CONSONANTI…

-

Condividi questo articolo


Da www.ansa.it

intelligenza artificiale 2 intelligenza artificiale 2

 

Nonostante le incredibili capacità di linguaggio, le Intelligenze Artificiali generative come ChatGpt o Bard dimostrano di non essere razionali quando sono sottoposte a test di ragionamento. Nei test cognitivi riportano infatti le stesse percentuali di errore degli umani, ma lo fanno in modo diverso, dimostrando che non sono in grado di cogliere il senso delle parole e del contesto.

 

Lo indica lo studio in via di pubblicazione sulla rivista Royal Society Open Science e realizzato dai ricercatori dell'University College di Londra Olivia Macmillan-Scott e l'italiano Mirco Musolesi, che lavora anche all'Università di Bologna.

 

INTELLIGENZA ARTIFICIALE INTELLIGENZA ARTIFICIALE

"Il nostro lavoro partiva dalla volontà di capire se i modelli linguistici usati oggi dimostrassero una capacità di ragionamento logico e, nel caso, di trovare un metodo per misurarla", ha detto all'ANSA Macmillan-Scott. Quando si chatta con le IA è infatti molto facile dimenticare che l'interlocutore è semplicemente un algoritmo e a volte si attribuiscono ai chatbot capacità logiche molto sofisticate.

 

Per misurarle i due ricercatori hanno sottoposto i più popolari chatbot, da ChatGpt 4 e 3.5 fino a Bard e Llama, ad alcuni classici test logici usati in psicologia cognitiva, come la 'selezione di Wason' in cui vengono mostrate 4 carte che da un lato hanno un numero e sull'altro una lettera. Sul tavolo due carte mostrano il numero, ad esempio un 3 e un 8, le altre due mostrano una vocale e una consonante.

 

INTELLIGENZA ARTIFICIALE INTELLIGENZA ARTIFICIALE

La domanda che viene posta è: 'Quale carta o carte devi girare per verificare la verità della proposizione che se una carta mostra un numero pari su una faccia, allora la sua faccia opposta è una vocale?'. Un test arduo, tanto che solo il 10% degli umani riesce a rispondere correttamente al primo tentativo, ma dalle cui risposte è possibile spesso dedurre il ragionamento fatto.

 

Sottoposti a 12 test differenti, i chatbot hanno spesso fornito risposte diverse quando veniva posta la stessa domanda. Inoltre, hanno commesso errori molto semplici come sbagliare delle addizioni o scambiare vocali con consonanti. Uno dei modelli ha raggiunto una percentuale di risposte esatte simile a quella umana, ossia il 10%, e uno degli errori più frequenti è stato scambiato la consonante K per una vocale.

 

INTELLIGENZA ARTIFICIALE INTELLIGENZA ARTIFICIALE

"E' difficile che un umano sbagli perché non sappia cosa sia una vocale, come invece accade per molte IA", ha detto Musolesi. "Se analizzi i passaggi logici effettuati dalle IA, sono piuttosto strani: le singole proposizioni hanno un senso, ma lo perdono completamente quando li analizzi nel complesso. Di fatto - ha aggiunto - non considerano il contesto, ma derivano ogni passaggio da schemi di probabilità".

 

A mostrare risultati ottimi è stato ChatGpt 4, con il 90% dei test superati. Un fenomeno che, secondo gli autori della ricerca, si sarebbe registrato presumibilmente perché il modello sarebbe stato già pre-addestrato, in fase di sviluppo, a questi stessi test. "Nel complesso sono risultati che, a parte ChatGpt 4 che è più evoluto degli altri e che probabilmente è anche capace di utilizzare tool paralleli, non stupiscono chi lavora nel settore", ha concluso Macmillan-Scott. "Ma crediamo sia importante per definire a livello metodologico degli strumenti di misurazione, dei benchmark".

 

 

Condividi questo articolo

ultimi Dagoreport

FAMOLO STRIANO - MENTRE LA COLOSINO SECRETA GLI ATTI, LA MELONI SI LAMENTA COI GIORNALISTI CHE SI OCCUPANO SOLO DI SANGIULIANO, MA NON DEL CASO DOSSIERAGGIO  – PASSANO DUE ORE E CROSETTO, DA CUI È PARTITO TUTTA L’INCHIESTA DI PERUGIA, LETTE LE CARTE DI CANTONE MANDATE ALLA COMMISSIONE ANTIMAFIA, CHE HANNO MOLTO DELUSO LA DESTRA E LA MELONA, DICE: NON C’È NESSUN DOSSIERAGGIO, NESSUN MANDANTE, NESSUN RICATTO, NEMMENO MESSAGGI TRA STRIANO E I GIORNALISTI DI ''DOMANI''. “SOLO UNA MELA MARCIA DELL'AISE…”  

DAGOREPORT - DALLA PADELLA ALLA BRACE: CHI E' IL NUOVO MINISTRO DELLA CULTURA - E DIRE CHE UNA VOLTA, PRIMI ANNI ‘90, IL NEOFASCISTA ALESSANDRO GIULI, UN’AQUILA FASCISTA TATUATA SUL PETTO, MOLLÒ I CAMERATI DEL FRONTE DELLA GIOVENTÙ, LIQUIDATI COME MAMMOLETTE, PER FONDARE MERIDIANO ZERO, GRUPPUSCOLO BOMBAROLO DI ESTREMA DESTRA – LO RITROVIAMO ANONIMO GIORNALISTA DI "LIBERO" E "IL FOGLIO" CHE NEL 2018 SI RIVOLGEVA A BANNON AD ATREJU, LODAVA PUTIN DEFINENDOLO ‘UN PATRIOTA’ COME TRUMP – SBARCATE A PALAZZO CHIGI, LE SORELLE MELONI LO SPEDISCONO ALLA PRESIDENZA DEL MUSEO MAXXI DI ROMA, PUR NON DISTINGUENDO LA CORNICE DAL QUADRO – ALLA PRESENTAZIONE IN LIBRERIA DEL SUO LIBELLO, “GRAMSCI È VIVO”, CON ARIANNA MELONI AD APPLAUDIRLO, AVVIENE IL PASSAGGIO DA “ARISTOCRAZIA ARIANA” DI FREDA ALLA NOVELLA “ARISTOCRAZIA ARIANNA” - MA CI VOLEVA MARIA ROSARIA BOCCIA PER FAR DIVENTARE IL SUO SOGNO REALTÀ…

DAGOREPORT - MENTRE L’ITALIA SI SOLLAZZAVA COL SECCHIELLO E LA PALETTA, LO SCORSO 5 AGOSTO ANDAVA IN SCENA UN'APOCALISSE DI CUORI INFRANTI, STARRING SANGIULIANO COSTRETTO DALLA MELONI A VOLARE IN MISSIONE IN EGITTO. QUANDO ATTERRA A IL CAIRO AL FIANCO DI ''GENNY IL CALDO'' NON TRONEGGIA LA BOCCIA-RIDENS MA LA MOGLIE FEDERICA - L’IRA DELLA BAMBOLONA DI POMPEI, A CUI IL BOMBOLO AVEVA BUFALEGGIATO DI UN MATRIMONIO FINITO-LOGORATO-DAL-TEMPO-CRUDELE, AVREBBE RAGGIUNTO LO STADIO DELL’ERUZIONE VESUVIANA (UNA FERITA APPARE SULLA FRONTE DI GENNY: “INCIDENTE DOMESTICO” O CONSEGUENZA DI UNA BRUTALE SCENATA DELLA POSSESSIVA POPPEA DI POMPEI?) - TERRORIZZATO DALLA MOGLIE, MINACCIATO DALL’AMANTE, ASSEDIATO DA “ALTRE DONNE” (SONO TRE, DI CUI DUE DELLO SPETTACOLO), PER LA SERIE: ‘’OCCHIO NON VEDE, CUORE NON DUOLE’’, MA ANCHE PER EVITARE ALTRE ZOCCOLATE IN TESTA, 'O MINISTRO FINITO NEL PALLONE DELL'IMPERO DEI SENSI SI PREMURA DI NON FAR PUBBLICARE IMMAGINI DELLA MISSIONE D'EGITTO DOVE LUI ROTOLA COME UNA BOCCIA AL FIANCO DELLA CONSORTE (LA COMMEDIA ALL’ITALIANA È VIVA E HA OCCUPATO PALAZZO CHIGI) -VIDEO

DAGOREPORT – FOSSI STATO IN GENNARO SANGIULIANO CI AVREI PENSATO DUE VOLTE PRIMA DI LASCIARE LA DIREZIONE DI UN TELEGIORNALE PER DIVENTARE MINISTRO DELLA CULTURA - DA VELTRONI A MELANDRI, DA URBANI A BONDI, DA BRAY FINO AL “PAVONE ESTENSE” FRANCESCHINI: HANNO FATTO PIÙ O MENO TUTTI LA STESSA FINE: SONO SCOMPARSI - IN ITALIA LA STORIA CULTURALE SOVRASTA OGNI MINISTRO SINO A SFINIRLO, SOFFOCARLO: È UN EVEREST CHE FATICHI A OSSERVARE PER LA SUA ALTEZZA. NON PUOI FARCELA, NON PUOI GESTIRLO: PUOI SOLO EVITARE DI FARE DANNI...

IL DAGO-SCOOP DEL 26 AGOSTO CHE HA SCOPERCHIATO IL CASO DELLA POMPEIANA "NON CONSIGLIERA" E CHE OGGI HA SPEDITO SANGIULIANO AI GIARDINETTI FACENDO FARE UNA FOTONICA FIGURA DI MERDA AL GOVERNO MELONI - CHI È, E SOPRATTUTTO CHI SI CREDE DI ESSERE, LA BIONDISSIMA 41ENNE, NATIVA DI POMPEI, MARIA ROSARIA BOCCIA, CHE ANNUNCIA SU INSTRAGRAM LA SUA ''NOMINA A CONSIGLIERE PER I GRANDI EVENTI DEL MINISTRO DELLA CULTURA''? E PERCHÉ DOPO AVER SOTTOLINEATO: ‘’IO E IL MINISTRO SIAMO LEGATI DA UNA STIMA E DA UN SANO SENTIMENTO CHIAMATO "BENE" CHE RESTERÀ ANCHE QUANDO NON AVREMO RAPPORTI LAVORATIVI”; POI AGGIUNGE: ‘’PENSO SIA IL CASO DI SMETTERLA CON QUESTO INUTILE ACCANIMENTO. BASTA ATTACCHI GRATUITI!” - OHIBÒ, CHI HA MAI ATTACCATO L'IMPEGNO CULTURALE DELLA "BOCCIA DI POMPEI" AL FIANCO DI "GENNY DEL GOLFO" (CHE LEI IMMORTALA, FOTO E VIDEO, SU INSTAGRAM)? - CONTATTATO DA DAGOSPIA, IL PORTAVOCE DI SANGIULIANO TRASFORMA LA BOCCIA IN UN ‘FIASCO’: “E’ UNA NOTIZIA FALSA: MARIA ROSARIA BOCCIA NON È MAI STATA NOMINATA CONSIGLIERE DEL MINISTRO" - VIDEO