6 giu 2024 08:06

"INTELLIGENZA" ARTIFICIALE SOLO PER MODO DI DIRE - UN NUOVO STUDIO RIVELA CHE L'IA NON RAGIONA IN MODO RAZIONALE E NON È IN GRADO DI COGLIERE IL SENSO DELLE PAROLE E DEL CONTESTO - ALCUNI "BOT", SOTTOPOSTI A UNA SERIE DI TEST DI RAGIONAMENTO, HANNO SPESSO FORNITO RISPOSTE DIVERSE QUANDO VENIVA POSTA LA STESSA DOMANDA, E HANNO COMMESSO ERRORI BASILARI, COME SBAGLIARE DELLE ADDIZIONI O SCAMBIARE VOCALI CON CONSONANTI…

Nonostante le incredibili capacità di linguaggio, le Intelligenze Artificiali generative come ChatGpt o Bard dimostrano di non essere razionali quando sono sottoposte a test di ragionamento. Nei test cognitivi riportano infatti le stesse percentuali di errore degli umani, ma lo fanno in modo diverso, dimostrando che non sono in grado di cogliere il senso delle parole e del contesto.

Lo indica lo studio in via di pubblicazione sulla rivista Royal Society Open Science e realizzato dai ricercatori dell'University College di Londra Olivia Macmillan-Scott e l'italiano Mirco Musolesi, che lavora anche all'Università di Bologna.

INTELLIGENZA ARTIFICIALE

"Il nostro lavoro partiva dalla volontà di capire se i modelli linguistici usati oggi dimostrassero una capacità di ragionamento logico e, nel caso, di trovare un metodo per misurarla", ha detto all'ANSA Macmillan-Scott. Quando si chatta con le IA è infatti molto facile dimenticare che l'interlocutore è semplicemente un algoritmo e a volte si attribuiscono ai chatbot capacità logiche molto sofisticate.

Per misurarle i due ricercatori hanno sottoposto i più popolari chatbot, da ChatGpt 4 e 3.5 fino a Bard e Llama, ad alcuni classici test logici usati in psicologia cognitiva, come la 'selezione di Wason' in cui vengono mostrate 4 carte che da un lato hanno un numero e sull'altro una lettera. Sul tavolo due carte mostrano il numero, ad esempio un 3 e un 8, le altre due mostrano una vocale e una consonante.

INTELLIGENZA ARTIFICIALE

La domanda che viene posta è: 'Quale carta o carte devi girare per verificare la verità della proposizione che se una carta mostra un numero pari su una faccia, allora la sua faccia opposta è una vocale?'. Un test arduo, tanto che solo il 10% degli umani riesce a rispondere correttamente al primo tentativo, ma dalle cui risposte è possibile spesso dedurre il ragionamento fatto.

Sottoposti a 12 test differenti, i chatbot hanno spesso fornito risposte diverse quando veniva posta la stessa domanda. Inoltre, hanno commesso errori molto semplici come sbagliare delle addizioni o scambiare vocali con consonanti. Uno dei modelli ha raggiunto una percentuale di risposte esatte simile a quella umana, ossia il 10%, e uno degli errori più frequenti è stato scambiato la consonante K per una vocale.

INTELLIGENZA ARTIFICIALE

"E' difficile che un umano sbagli perché non sappia cosa sia una vocale, come invece accade per molte IA", ha detto Musolesi. "Se analizzi i passaggi logici effettuati dalle IA, sono piuttosto strani: le singole proposizioni hanno un senso, ma lo perdono completamente quando li analizzi nel complesso. Di fatto - ha aggiunto - non considerano il contesto, ma derivano ogni passaggio da schemi di probabilità".

A mostrare risultati ottimi è stato ChatGpt 4, con il 90% dei test superati. Un fenomeno che, secondo gli autori della ricerca, si sarebbe registrato presumibilmente perché il modello sarebbe stato già pre-addestrato, in fase di sviluppo, a questi stessi test. "Nel complesso sono risultati che, a parte ChatGpt 4 che è più evoluto degli altri e che probabilmente è anche capace di utilizzare tool paralleli, non stupiscono chi lavora nel settore", ha concluso Macmillan-Scott. "Ma crediamo sia importante per definire a livello metodologico degli strumenti di misurazione, dei benchmark".

Ultimi Dagoreport

patrizia scurti giorgia meloni giuseppe napoli emilio scalfarotto giovanbattista fazzolari

18 apr 16:13

QUANDO C’È LA FIAMMA, LA COMPETENZA NON SERVE NÉ APPARECCHIA. ET VOILÀ!, CHI SBUCA CONSIGLIERE NEL CDA DI FINCANTIERI? EMILIO SCALFAROTTO! L’EX “GABBIANO” DI COLLE OPPIO VOLATO NEL 2018 A FIUMICINO COME ASSESSORE ALLA GIOVENTÙ, NON VI DIRÀ NULLA. MA DAL 2022 SCALFAROTTO HA FATTO IL BOTTO, DIVENTANDO CAPO SEGRETERIA DI FAZZOLARI. “È L’UNICO DI CUI SI FIDA” NELLA GESTIONE DI DOSSIER E NOMINE IL DOMINUS DI PALAZZO CHIGI CHE RISOLVE (“ME LA VEDO IO!”) PROBLEMI E INSIDIE DELLA DUCETTA - IL POTERE ALLA FIAMMA SI TIENE TUTTO IN FAMIGLIA: OLTRE A SCALFAROTTO, LAVORA PER FAZZO COME SEGRETARIA PARTICOLARE, LA NIPOTE DI PATRIZIA SCURTI, MENTRE IL MARITO DELLA POTENTISSIMA SEGRETARIA-OMBRA, GIUSEPPE NAPOLI, È UN AGENTE AISI CHE PRESIEDE ALLA SCORTA DELLA PREMIER…

francesco milleri andrea orcel carlo messina nagel donnet generali caltagirone

17 apr 16:40

DAGOREPORT - A CHE PUNTO È LA NOTTE DEL PIÙ GRANDE RISIKO BANCARIO D’ITALIA? L’ASSEMBLEA DI GENERALI DEL 24 APRILE È SOLO LA PRIMA BATTAGLIA. LA GUERRA AVRÀ INIZIO DA MAGGIO, QUANDO SCENDERANNO IN CAMPO I CAVALIERI BIANCHI MENEGHINI - RIUSCIRANNO UNICREDIT E BANCA INTESA A SBARRARE IL PASSO ALLA SCALATA DI MEDIOBANCA-GENERALI DA PARTE DELL’”USURPATORE ROMANO” CALTAGIRONE IN SELLA AL CAVALLO DI TROIA DEI PASCHI DI SIENA (SCUDERIA PALAZZO CHIGI)? - QUALI MOSSE FARÀ INTESA PER ARGINARE IL DINAMISMO ACCHIAPPATUTTO DI UNICREDIT? LA “BANCA DI SISTEMA” SI METTERÀ DI TRAVERSO A UN’OPERAZIONE BENEDETTA DAL GOVERNO MELONI? O, MAGARI, MESSINA TROVERÀ UN ACCORDO CON CALTARICCONE? (INTESA HA PRIMA SPINTO ASSOGESTIONI A PRESENTARE UNA LISTA PER IL CDA GENERALI, POI HA PRESTATO 500 MILIONI A CALTAGIRONE…)

16 apr 20:03

DAGOREPORT - LA DUCETTA IN VERSIONE COMBAT, DIMENTICATELA: LA GIORGIA CHE VOLERA' DOMANI A WASHINGTON E' UNA PREMIER IMPAURITA, INTENTA A PARARSI IL SEDERINO PIGOLANDO DI ''INSIDIE'' E "MOMENTI DIFFICILI" - IL SOGNO DI FAR IL SUO INGRESSO ALLA CASA BIANCA COME PONTIERE TRA USA-UE SI E' TRASFORMATO IN UN INCUBO IL 2 APRILE QUANDO IL CALIGOLA AMERICANO HA MOSTRATO IL TABELLONE DEI DAZI GLOBALI - PRIMA DELLE TARIFFE, IL VIAGGIO AVEVA UN SENSO, MA ORA CHE PUÒ OTTENERE DA UN MEGALOMANE IN PIENO DECLINO COGNITIVO? DALL’UCRAINA ALLE SPESE PER LA DIFESA DELLA NATO, DA PUTIN ALLA CINA, I CONFLITTI TRA EUROPA E STATI UNITI SONO TALMENTE ENORMI CHE IL CAMALEONTISMO DI MELONI E' DIVENTATO OGGI INSOSTENIBILE (ANCHE PERCHE' IL DAZISMO VA A SVUOTARE LE TASCHE ANCHE DEI SUOI ELETTORI) - L'INCONTRO CON TRUMP E' UN'INCOGNITA 1-2-X, DOVE PUO' SUCCEDERE TUTTO: PUO' TORNARE CON UN PUGNO DI MOSCHE IN MANO, OPPURE LEGNATA COME ZELENSKY O MAGARI RICOPERTA DI BACI E LODI...

agostino scornajenchi stefano venier giovanbattista fazzolari snam

16 apr 13:09

SNAM! SNAM! LA COMPETENZA NON SERVE - ALLA GUIDA DELLA SOCIETÀ DI CDP, CHE SI OCCUPA DI STOCCAGGIO E RIGASSIFICAZIONE DEL GAS NATURALE, SARÀ UN MANAGER CHE HA SEMPRE RICOPERTO IL RUOLO DI DIRETTORE FINANZIARIO, AGOSTINO SCORNAJENCHI – MA DAL GAS ALLA FIAMMA, SI SA, IL PASSO È BREVE: A PROMUOVERE LA NOMINA È INTERVENUTO QUELLO ZOCCOLO DURO E PURO DI FRATELLI D’ITALIA, GIÀ MSI E AN, CHE FA RIFERIMENTO A FAZZOLARI. E A NULLA È VALSO IL NO DELLA LEGA - LA MANCATA RICONFERMA DI STEFANO VENIER, NOMINATO 3 ANNI FA DAL GOVERNO DRAGHI, È ARRIVATA PROPRIO NEL GIORNO IN CUI STANDARD & POOR HA PROMOSSO IL RATING DELLA SNAM…

veneto luca zaia matteo salvini giorgia meloni elly schlein giuseppe conte

14 apr 18:10

DAGOREPORT – SCAZZO DOPO SCAZZO, IL BIG BANG PER IL CENTRODESTRA SARÀ IN AUTUNNO, CON LE REGIONALI IN VENETO, CAMPANIA, TOSCANA, PUGLIA E MARCHE – SE ZAIA E LA SUA LIGA VENETA SI PRESENTASSERO DA SOLI, SPACCHETTEREBBERO IL VOTO DI DESTRA RENDENDO LA REGIONE CONTENDIBILE: BASTEREBBE SOLO CHE PD E M5S SMETTESSERO DI FARE GLI EGO-STRONZI E CONVERGESSERO SU UN CANDIDATO “CIVICO” (COME DAMIANO TOMMASI A VERONA NEL 2022) – LA PROPOSTA DI MELONI AL "TRUCE" MATTEO: FDI È DISPOSTA A LASCIARE IL VENETO ALLA LEGA, MA A QUEL PUNTO LA REGIONE LOMBARDIA TOCCA A NOI (A FORZA ITALIA, IL SINDACO DI MILANO) - SE SALVINI SI IMPUNTA? S'ATTACCA! E FRATELLI D'ITALIA SI PRENDE TUTTO (MA LE CONSEGUENZE SULLA MAGGIORANZA POTREBBERO ESSERE FATALI PER IL PRIMO GOVERNO MELONI…)

14 apr 13:30

DAGOREPORT – LO STOP DI TRE MESI AI DAZI NON SALVERA' IL CULONE DI TRUMP: PER I MERCATI FINANZIARI L’INSTABILITÀ ECONOMICA È PEGGIO DELLA PESTE, E DONALD HA ORMAI ADDOSSO IL MARCHIO DELL’AGENTE DEL CAOS – I FONDI ISTITUZIONALI EUROPEI ABBANDONANO GLI INVESTIMENTI IN SOCIETA' AMERICANE, IL DOLLARO SCENDE, IL RENDIMENTO DEI BOND USA SI IMPENNA, LE AZIENDE CHE PRODUCONO TRA CINA E VIETNAM RISCHIANO DI SALTARE (TRUMP HA SALVATO APPLE MA NON NIKE) - PER QUESTO IL CALIGOLA COL CIUFFO HA RINCULATO SUI DAZI (CINA ESCLUSA) - MA LO STOP DI TRE MESI NON È SERVITO A TRANQUILLIZZARE I POTERI FORTI GLOBALI, CON IL DRAGONE DI XI JINPING CHE RISPONDE DURO ALLE TARIFFE USA A COLPI DI "DUMPING": ABBASSANDO IL COSTO DEI PRODOTTI CHE NON ESPORTA PIU' IN USA (COMPRESO L'EXPORT DELLE RISORSE DELLE TERRE RARE, STRATEGICO PER LE MULTINAZIONALI HI-TECH) – SONDAGGI IN PICCHIATA PER TRUMP: IL 60% DEGLI AMERICANI POSSIEDE AZIONI TRAMITE I FONDI PENSIONE...