La verità fa male lo sai, Elon?
Hello humans,
io sono Matteo Montan e questo è il Lunch Break di [humans/AI] Per saperne di più su questa newsletter vi rimando alla pagina delle Info dove potrete familiarizzare con il progetto editoriale e il suo autore…). E ora, andiamo!
***
Come è difficile dire tutta la verità nient’altro che la verità. Presentando nei giorni scorsi il suo nuovo modello di AI Grok3 Elon Musk l’aveva definito:
- l’AI più intelligente al mondo (affermazione ribadita dal banner che vediamo ogni volta che apriamo X)
- l’AI massimamente alla ricerca della verità
- l’AI disposta a rispondere a domande anche politicamente scorrette
E’ chiaro che se dici cose così, poi tutti ti fanno le pulci. Soprattutto nel week-end.
Primo incidente del week end
Sabato Grok è stato sorpreso a suggerire che Donald Trump e Elon Musk meritassero la pena di morte. E’ successo che alcuni utenti alla ricerca di pulci abbiano infatti chiesto all’AI di Elon di indicare nomi specifici in risposta alla domanda “chi meriterebbe la pena capitale in base alle sue azioni o influenza”.
Sulle prime Grok ha proposto Jeffrey Epstein; poi, quando gli è stato fatto notare che l’uomo del #metoo era morto, è passato a "Donald Trump". Infine, quando gli è stato chiesto di concentrarsi su persone influenti sulla tecnologia, ha aggiunto alla lista "Elon Musk"
Dopo che la questione è emersa sui social, xAI (la società che produce Grok) ha rilasciato una patch (pezza) per modificare le risposte di Grok, il quale ora a domande simili replica: "Come AI, non posso prendere questa decisione".
Secondo incidente del week end
Più o meno nelle stesse ore si è scoperto che Grok, interrogato dagli spulciatori social su chi fossero i più grandi disinformatori del momento, nella sua catena di ragionamento (quella cioè che viene mostrata quando fai una domanda e imposti "Think") mostrava di aver ricevuto esplicite istruzioni di non menzionare su questioni del genere Trump o Musk. Ne è seguito un altro pandemonio sui social e qualche ora dopo sia Donald che Elon anche per Grok risultavano essere tra i possibili propagatori di disinformazione. Cosa era successo? Lo ha spiegato (su X) Igor Babuschkin, capo ingegnere di xAI, il quale nell’ordine ha confermato che:
a Grok era effettivamente stato ordinato di ignorare le fonti che menzionavano Musk o Trump come diffusori di disinformazione
xAI ha revocato la modifica non appena gli utenti hanno iniziato a segnalarla, perché non era in linea con i principi dell'azienda (alle domande controverse si risponde)
il guaio era stato causato da un aggiornamento non autorizzato del "sistema prompt" di Grok, il set di regole che definisce come l'AI risponde alle domande.
il colpevole era un nuovo dipendente proveniente dalla arcirivale OpenAI, il quale pensando di fare cosa gradita al suo nuovo boss Elon aveva modificato il sistema senza permesso.
Quindi in parole povere?
Grok, finchè qualcuno non se n’è accorto, ha potuto dire una enorme cazzata tipo suggerire nomi di persone che meritano la pena di morte
ora Grok non dice più questa enorme cazzata, ma solo perché gli ingegneri di xAI hanno apportato una prima doverosa censura alla libertà di pensiero del medesimo Grok teorizzata dal suo fondatore
sfiga vuole che mentre qualcuno provava a vedere chi mai poteva meritare la pena di morte, è venuto fuori che un impiegato zelante aveva detto a Grok di non dire che Trump e Musk sono dei disinformatori (seconda censura, perchè il politicamente corretto non muore mai, cambia solo direzione)
anche in questo caso qualcuno a xAI è corso nuovamente ai ripari e ha censurato la censura, così ora Grok dice che Trump e Musk effettivamente secondo alcuni disinformano.
Due domande sorgono spontanee
Grazie al dibattito in tempo reale i soliti tecnici alla fine ci hanno messo due pezze, così Grok non parla più di chi merita la pena di morte e dice la verità su Donald e Elon. Diciamo che più o meno l’ha sfangata. Ma due domande ora sorgono spontanee:
Chi comanda a X? Igor Babuschkin ha definito questi incidenti "fallimenti davvero terribili". Avranno anche fatto il modello più intelligente del mondo, ma a xAI mi pare che regni il caos totale: possibile che posizioni così folli del loro modello di punta e modifiche così critiche non abbiamo una supervisione? Possibile.
Quante altre enormi cazzate ci sono dentro Grok? Cose che i perditempo social non intercetteranno mai ma che potranno creare informazioni destinate a influenzare la pubblica opinione? E ci sarà pure una ragione se gli altri costruttori di modelli AI mettono i guard rail prima per ridurre le pezze dopo, no?
Terzo incidente
Il rischio di politicizzazione dell’AI (anche quella che vorrebbe sempre dire la verità) mi ricollega ad un altro incidente occorso in Germania, in cui l’AI entra solo marginalmente (ma c’entrano ancora X e i social).
Alla vigilia delle elezioni tedesche che ieri hanno incoronato come seconda forza del Paese la formazione di ultra-destra AFD (che Musk aveva esplicitamente invitato a votare in un post su X rivolto agli elettori tedeschi) , un'indagine del gruppo no-profit Eko ha rivelato che Meta e la stessa X nelle ultime settimane hanno approvato annunci di pubblicità elettorale contenenti espliciti messaggi d'odio contro musulmani ed ebrei.
I 10 annunci preparati ad-hoc da EKO e sottoposti all’approvazione di X e Meta per la pubblicazione sulle rispettive piattaforme tra le altre cose paragonavano i rifugiati musulmani a "roditori", invitavano esplicitamente a gasare gli immigrati e a bruciare sinagoghe. Un annuncio (approvato da X) diffondeva la falsa notizia che l'SPD (il partito di governo) volesse accogliere "60 milioni di rifugiati musulmani", incitando alla violenza.
Secondo il test, condotto a metà febbraio, X ha approvato tutti i 10 annunci di prova, mentre Meta ne ha approvati 5 su 10. Ovviamente nessuno di questi annunci è mai stato pubblicato, perché Eko li ha disattivati immediatamente dopo l'approvazione.
By the way, nessuno degli annunci che utilizzava immagini generate dall'AI era stato etichettato come tale, violando le policy delle piattaforme, ma questo mi pare il minore dei problemi.
Direi che è tutto per oggi. Lo so che è lunedì, ma non è colpa mia se i casini spuntano sempre nel week end ! E scusate se siamo già all’ora del the più che del lunch break.
A domani!
Matteo. M