Bender, Gebru, McMillan-Major, Shmitchell: Sui pericoli dei pappagalli stocastici: i modelli linguistici possono essere troppo grandi?

Vuoi iscriverti alla newsletter?

Avviso ai lettori

Sembra che il modulo di iscrizione alla newsletter non funzioni su Chrome e derivate (Brave, Vivaldi, ecc.). Chi voglia iscriversi avendo a disposizione soltanto uno di questi programmi può farlo utilizzando il cellulare, oppure spedire una email all'indirizzo tonino1@sinistrainrete.info specificando:

1) nome utente,

2) indirizzo email,

3) se si vuole ricevere la Newsletter in formato html o testo semplice,

4) se interessano tutti gli articoli o solo quelli in evidenza.

Ci scusiamo per l'inconveniente.

Notizie sull'operazione speciale condotta dall'esercito russo in Ucraina

A cura di Paolo Selmi

Clicca qui per gli ultimi aggiornamenti

Clicca qui per le notizie fino al 29/02/24

Clicca qui per le notizie fino al 13/12/23

Clicca qui per le notizie fino al 1/10/23

Clicca qui per le notizie fino al 23/6/23

Clicca qui per le notizie fino al 20/4/23

Clicca qui per le notizie fino al 26/2/23

Clicca qui per le notizie fino al 6/1/23

Clicca qui per le notizie fino al 14/11/22

Clicca qui per le notizie fino al 4/10/22

Clicca qui per le notizie fino al 29/8/22

Clicca qui per le notizie fino al 9/7/22

Clicca qui per le notizie fino al 28/5/22

Clicca qui per le notizie fino al 3/5/22

Cliccaqui per le notizie fino al 6/4/22

Articoli meno recenti

comidad: L'oppio delle masse arabe e la cocaina di Israele

Information
16 April 2024 451 hit(s)

Le parole dovrebbero essere annoverate nell’elenco delle droghe pesanti, e purtroppo a chiunque può capitare di farsi ogni tanto una “pera” eccessiva. Il quotidiano neocon “il Foglio” si è approfittato del “trip” di uno dei padri costituenti, Umberto Terracini, per fargli fare una figuraccia postuma mettendo in evidenza alcune sue frasi poco felici in sostegno di Israele. Dopo averci ammonito sul fatto che anche Terracini considerava l’antisionismo una forma di antisemitismo, ci viene proposta una citazione nella quale il vecchio comunista...

leggi tutto
Agata Iacono: I successi del boicottaggio al regime israeliano: il caso McDonald's e l'app "No Thanks"

Information
16 April 2024 430 hit(s)

Da questa parte del "mondo democratico occidentale", molti di noi si dibattono tra rabbia e la sensazione drammatica di impotenza nell'assistere allo sterminio in diretta di un intero popolo. A volte questo senso di frustrazione si trasforma in disagio somatizzato, in depressione (parlo per me e per gli amici e compagni con cui mi confronto ogni giorno). In altri casi, invece, rischia di generare reazioni di autoconservazione fatalista, ricerca del deus ex machina, rimozione. Eppure qualcosa si muove. Qualcosa possiamo fare. Una piccola...

leggi tutto
Alberto Bradanini: Ancora su Julian Assange, sì ancora e ancora, fino alla libertà

Information
16 April 2024 294 hit(s)

1. Seguendo un copione creato a tavolino per ingannare la mente di chi si abbevera ai telegiornali della sera, gli Stati Uniti continuano a tirare il guinzaglio legato al collo del cagnolino d’oltremanica. Quel cagnolino era un tempo l’Impero britannico’, oggi solo un maggiordomo che esegue gli ordini dell’Impero Atlantico: tenere Julian Assange in prigione fino alla morte. Per la più grande democrazia al mondo – da esportare, se del caso, a suon di bombe e che ormai solo i politici europei (e italiani) credono sia tale – il rischio più...

leggi tutto
Martino Dettori: Benvenuti nella seconda guerra mondiale 2.0

Information
16 April 2024 412 hit(s)

Qualcuno parla di rischio di terza guerra mondiale davanti alla rappresaglia dell’Iran verso Israele, ma cari miei, una terza guerra mondiale sarebbe solo nucleare. Perciò, definitivamente distruttiva dell’umanità. Avete presente l’anime e il manga “Ken il Guerriero”? Lì, almeno, le armi nucleari sono state relativamente innocue: hanno distrutto il mondo, ma non hanno lasciato radiazioni. Ma nella realtà, una guerra di tale portata, ridurrebbe il mondo a una landa desolata radioattiva, invivibile. E per quanto noi siamo governati dai...

leggi tutto
coniarerivolta: Approvato il DEF: il Governo nasconde l’austerità

Information
15 April 2024 572 hit(s)

Il Governo è in difficoltà, è debole. Questo è il precipitato politico di un ragionamento che prende le mosse dalla scelta del Governo di approvare un Documento di economia e finanza (DEF) privo delle principali informazioni sulle tendenze della finanza pubblica e dei conseguenti effetti macroeconomici. Il DEF è il principale strumento di programmazione economica del Governo, serve a definire il quadro della finanza pubblica per l’anno in corso e per il successivo triennio. In pratica, con il DEF il Governo è chiamato a mettere nero su bianco...

leggi tutto
Piccole Note: Zaporizhzhia, le bombe sulla centrale atomica

Information
15 April 2024 602 hit(s)

Dopo l’oblio dell’attacco al Crocus da parte dei media d’Occidente, preoccupati solo di discolpare l’Ucraina dalle evidenti responsabilità, come peraltro accaduto varie volte in passato – a parte eccezioni che confermano la regola – per altre azioni oscure di Kiev, anche l’attacco di droni alla centrale atomica di Zaporizhzhia è passato sottotraccia, come qualcosa di marginale. L’attacco alla centrale di Zaporizhzhia e i topos delle guerre infinite E ciò nonostante la gravità dell’accaduto: se l’attacco fosse riuscito al 100% poteva creare...

leggi tutto
Emma Bracci: Curare la colpa

Information
15 April 2024 566 hit(s)

Il senso di colpa domina incontrastato nella multiforme platea dei sentimenti umani. Senso di colpa per non essere abbastanza, per non aver superato l’esame, per non aver performato quanto desideravamo, per aver disatteso le aspettative, per non aver concluso un lavoro, per aver trascurato passioni e interessi, per aver manifestato rabbia, tristezza e paura, per gli errori commessi, per le azioni compiute, per una parola fuori posto, per non esserci stata, per aver mangiato, per aver risposto nervosamente, per quella carezza non data, quei...

leggi tutto
Dante Barontini: Non è un mondo per far figli

Information
15 April 2024 602 hit(s)

Immancabili, come ogni anno, i dati Istat sull’andamento demografico del paese registrano un deciso segno meno”. Che non è grave soltanto in sé, ma soprattutto perché conferma una tendenza di lunghissimo periodo. Dal 1964 a oggi sono stati pochissimi gli anni in cui le nuove nascite sono state più numerose dell’anno precedente, ma anche a uno sguardo disattento balza agli occhi che la dimensione delle diminuzioni è sempre alta, mente i “rimbalzi” sono sempre appena percettibili. Il risultato finale, al 2023, non lascia dubbi: i nuovi nati...

leggi tutto
Alba Vastano: Fascista è chi fascista fa

Information
14 April 2024 657 hit(s)

‘Essere democratici è una fatica immane. Allora perché continuiamo a esserlo quando possiamo prendere una scorciatoia più rapida e sicura?’. Così Michela Murgia, la scrittrice sarda recentemente scomparsa, nel suo pamphlet del 2018 dal titolo provocatorio: ‘Istruzioni per diventare fascisti’. Con una originale sapienza dialettica, com’era suo stile di comunicazione in ogni dibattito pubblico e nel relazionare sulle grandi ingiustizie e ineguaglianze che affliggono le società odierne, Michela Murgia, nel suo saggio, ci invita a sottoporci a...

leggi tutto
Vincenzo Maddaloni: Voglia di Rivoluzione. Tra censure e bugie la libertà svanisce

Information
14 April 2024 513 hit(s)

I due anni della pestilenza da Covid-19 si sono rivelati una grande imprevedibile opportunità per testare il livello di ubbidienza che, si può ottenere applicando un regime disciplinare come lo è stato l’obbligo di vaccinarsi, appunto. La narrativa secondo la quale il barbaro no-vax e chi lo sostiene rappresentano il Male, e quindi vanno denigrati, censurati, emarginati, criminalizzati ha funzionato. Pertanto, lo stesso identico canone è stato applicato su una nuova dicotomia buono-cattivo nella politica internazionale. Stesso manicheismo,...

leggi tutto
Fabrizio Poggi: Il terrorismo ucraino e le velleità interventiste occidentali

Information
14 April 2024 528 hit(s)

L’avesse compiuto, per dire, il Ministro degli esteri russo Sergej Lavrov, un gesto come quello del suo omologo britannico David Cameron, recatosi in “visita di lavoro” da Donald Trump in USA, intrattenendosi – magari – in Germania, con Sahra Wagenknecht, per di più alla vigilia delle elezioni, il coro liberal avrebbe subitamente gridato alle «interferenze russe nei processi democratici dei paesi liberi». Ma fatto tra “alleati”, per di più di estrazione anglosassone, la cosa rientra nella normalità e, trattandosi della “democratica Ucraina...

leggi tutto
Fulvio Grimaldi: Israele non vince, Hamas non perde - LA PALESTINA ACCENDE IL MONDO - Quisling collaborazionisti fuorigioco

Information
14 April 2024 566 hit(s)

Un’analisi di cosa succede e di cosa si prospetta in Medioriente, a partire dal genocidio in atto a Gaza, dalla rivolta generale palestinese, dallo scontro tra Stato Sionista e Asse della Resistenza in Libano, Siria, Iraq, Yemen, all’indomani dell’attacco israeliano all’ambasciata iraniana a Damasco. Una panoramica che parte dalla ritirata della FOI (Forza di Offesa Israeliana) dalla metà sud di Gaza, dopo sei mesi di offensiva del presunto “esercito più potente del Medioriente” che non è riuscito a controllare la Striscia, annientare Hamas e...

leggi tutto
Mattia Giampaolo: 9 Aprile di sciopero per la Palestina: dalle università, alle fabbriche e ai porti, costruiamo una vera mobilitazione generale!

Information
14 April 2024 488 hit(s)

In vista della settimana di mobilitazione dei lavoratori all’interno dell’accademia italiana, proponiamo qui un resoconto delle linee d’intervento del movimento negli ultimi mesi, mettendo al centro i punti politici principali che stanno caratterizzando le proteste dei lavoratori e delle lavoratrici dell’università di concerto con i movimenti studenteschi. Si tratta di una riflessione che vuole essere un punto di partenza che ci porti allo sciopero del 9 aprile di tutto il mondo universitario, una data che deve essere un punto di partenza per...

leggi tutto
Rosa Moro: “Sul genocidio in Ruanda, una disinformazione gigantesca”

Information
14 April 2024 563 hit(s)

Trent’anni dopo il genocidio in Ruanda, innescato dall’abbattimento dell’aereo privato su cui viaggiavano il presidente del Paese e il suo omologo del Burundi, e spacciato per l’esplosione di un conflitto etnico tra Hutu e Tutsi, si continua a discutere sulle cause del massacro di quasi un milione di persone. Dopo tre decenni, si evidenziano implicazioni che gettano una luce meno semplificata su quegli eventi drammatici: a cominciare dal ruolo delle grandi potenze che cercavano di accaparrarsi le enormi risorse strategiche nella regione dei...

leggi tutto
Giuseppe Masala: Il vero motivo per cui Yellen è tornata a Pechino

Information
13 April 2024 522 hit(s)

È certamente corretto sostenere che le motivazioni che stanno spingendo Washington a mettere sotto assedio Pechino sono di natura economica. Paradossalmente questa tesi è stata infatti espressa indirettamente dalla stessa Segretario al Tesoro Yellen, in una intervista della settimana scorsa che non ha avuto la risonanza che avrebbe meritato nonostante anticipasse i temi che la stessa Yellen sta trattando con l'élite politica cinese nel suo viaggio diplomatico in corso in questi giorni. Di importanza capitale per comprendere la situazione a...

leggi tutto
Piccole Note: Fabio Mini e il tempo delle guerre infinite

Information
13 April 2024 595 hit(s)

Pubblichiamo un estratto della prefazione del libro “Ucraina, Europa, mondo. Guerra e lotta per l’egemonia mondiale” di Giorgio Monestarolo (Asterios, Trieste, pp.106, euro 13). L’autore è ricercatore presso il Laboratorio di Storia delle Alpi dell’Università della Svizzera italiana e docente di Storia e Filosofia al liceo Vittorio Alfieri di Torino. La prefazione è del generale Fabio Mini, che tra le altre cose è stato generale di Corpo d’Armata, Capo di Stato Maggiore del Comando NATO del Sud Europa e comandante della missione...

leggi tutto
Pierluigi Fagan: T.I.N.A. 2.0.

Information
13 April 2024 468 hit(s)

Volete uscire dal dominio neoliberista, volete allentare la morsa della gabbia d’acciaio capitalista, volete invertire l’allungamento in corso da decenni della scala sociale di cui tra l’altro vi è vietato l’uso per provare a scalarla. Avete idee di mondo migliore, più giusto, qualsiasi sia la vostra idea di “giusto”. Tutto ciò è politico. Ma la vostra società non è ordinata dal politico, è ordinata dall’economico. È l’economico il regolamento del gioco sociale, è lui a dettare scala di valori, premi, punizioni, mentalità e cultura comune. E...

leggi tutto
Enrique Dussel, “Marx e la modernità”Alessandro Visalli:

Information
13 April 2024 439 hit(s)

Nelle Conferenze di La Paz, nel 1995, il teologo e filosofo argentino, tra i pionieri della Teologia della Liberazione e in esilio dalla sua patria durante il regime fascista sviluppa la sua attentissima lettura di Marx dal punto di vista rivendicato dell’esternità e del lavoro ‘vivo’; ovvero della persona effettiva, reale, completa. Questo, declinato nelle sue diverse forme, marginali e ‘poveri’, stati subalterni e periferici, è il tema centrale della filosofia e della prassi politico-culturale ed etica di Dussel. Proviamo, dunque, a...

leggi tutto
Fulvio Grimaldi: Nato in NATO

Information
13 April 2024 471 hit(s)

Come ha potuto succedere? Che mostruosità! Tutte quelle armi che circolano! Ma in che tempi viviamo! Colpa dei genitori….Colpa della scuola…. Sono le esclamazioni dei manigoldi ipocriti che tendono a ottunderci il cervello mentre cerchiamo di farci capaci dell’enormità di un bambino di dodici anni che entra in classe con una pistola e spara e uccide suoi compagni. Si assembrano sugli schermi e nelle paginate psicologi, sociologi, esperti di ogni risma da un euro all’etto a disquisire sul fattaccio. E tutti, indistintamente, a mancare...

leggi tutto
Shivan Mahendrarajah: Qual è la strategia iraniana?

Information
13 April 2024 552 hit(s)

L’apparente moderazione dell’Iran di fronte all’aggressione israeliana non dovrebbe essere confusa con la debolezza. Teheran esercita costantemente pressioni su Tel Aviv attraverso i propri metodi, preparando attentamente il terreno per il disfacimento di Israele. «La leggenda narra che una rana posta in una pentola poco profonda piena d’acqua riscaldata su un fornello rimarrà felicemente nella pentola d’acqua mentre la temperatura continua a salire, e non salterà fuori anche se l’acqua raggiunge lentamente il punto di ebollizione e uccide la...

leggi tutto
Franco Beradi Bifo: La fine di Israele

Information
13 April 2024 594 hit(s)

Più passano i giorni, più Israele procede nella sua campagna di sterminio, più si isola dal resto del mondo, più comprendo che il pogrom del 7 ottobre, pur essendo, come non può che essere un pogrom, un’azione atroce moralmente inaccettabile, è stato un atto politico capace di cambiare la direzione del processo storico. La conseguenza immediata di quell’azione è stata lo scatenamento di un vero e proprio genocidio contro la popolazione di Gaza, ma il genocidio era in corso in modo strisciante da settantacinque anni, nei territori occupati, in...

leggi tutto
Emilio Gardini: Altre forme di costruzione del mondo

Information
10 April 2024 369 hit(s)

Marx era consapevole della difficoltà che l’idea di classe poneva come categoria che rappresenta un insieme eterogeneo di lavoratori, perché sapeva che il proletariato era composto non solo dagli operai di fabbrica ma da tanti altri lavoratori che, al pari di oggi, avevano in comune il fatto di trovarsi nella stessa posizione nei rapporti di potere. Tuttavia, nel pieno del capitalismo industriale, la classe in termini marxiani ha rappresentato una categoria utile a descrivere l’asimmetria dei rapporti di produzione e come questi fossero...

leggi tutto
Il Chimico Scettico: Le nove regole della censura (vecchia)

Information
10 April 2024 398 hit(s)

Premettendo che l'uscita di CS dai social ebbe molte ragioni circostanziate e che continuo a pensare che i social network siano già da tempo "territorio nemico", cominciamo mettendo in rilievo l'annuncio nell'articolo: Sabato 11 Maggio alle ore 10 presso il Centro Congressi Cavour sito a Roma in Via Cavour 50/a, ci riuniremo per il decennale de L’Interferenza e sarà l’occasione, oltre che per un dibattito politico sui vari temi di politica e di politica internazionale, anche per lanciare una battaglia per la libertà di informazione, per...

leggi tutto
Francesca Fulghesu: “Da Del Vecchio Junior a Livia Voigt: tutti i miliardari sotto i 30 anni hanno ereditato la propria ricchezza”

Information
10 April 2024 394 hit(s)

I ricchi sono sempre più ricchi, i poveri sono sempre più poveri. Alla base del divario, tra gli altri fattori, anche le eredità che in molti Paesi passano di mano senza essere tassate, o quasi. Così per la prima volta in 15 anni, secondo i dati di Forbes, tutti i miliardari sotto i 30 anni hanno ereditato la loro ricchezza. Detto in altri termini: nessuno di loro ha un’estrazione socio-economica familiare differente e si è “fatto da solo”. Addio ascensore sociale: il “grande trasferimento di ricchezza” – 84.000 miliardi di dollari nei...

leggi tutto
Alessandro Avvisato: Per l’Ucraina “il quadro è cupo”. Alti ufficiali parlano di crisi militare e politica

Information
09 April 2024 604 hit(s)

Il giornale statunitense Politico ha intervistato alcuni ufficiali militari ucraini di alto rango che hanno prestato servizio sotto il generale Valery Zaluzhny silurato a febbraio da Zelenski. Le conclusioni sono che per l’Ucraina “il quadro militare è cupo”. Gli ufficiali ucraini affermano che c’è un grande rischio che le linee del fronte crollino ovunque i generali russi decidano di concentrare la loro offensiva. Inoltre, grazie a un peso numerico molto maggiore e alle bombe aeree guidate che stanno distruggendo le posizioni ucraine ormai...

leggi tutto
Piccole Note: Netanyahu cerca l'escalation

Information
09 April 2024 325 hit(s)

L’assassinio del generale Reza Zahedi in un edificio dell’ambasciata iraniana di Damasco, assassinato insieme ad altri membri delle guardie rivoluzionarie, supera un’altra delle linee rosse che normalmente hanno limitato la portata dei conflitti del Secondo dopoguerra, evitando al mondo escalation ingestibili (il mondo guidato da regole esisteva prima dell’89; dopo il crollo del Muro, le regole sono state riscritte a uso e consumo degli Usa…). Anzitutto perché Israele ha colpito un alto ufficiale di una nazione non ufficialmente in guerra....

leggi tutto
Carlo Rovelli: “Sto dalla parte dei ragazzi delle Università. Il boicottaggio di Israele è ragionevole"

Information
09 April 2024 482 hit(s)

Sul quotidiano La Stampa di ieri è stata pubblicata una significativa intervista al fisico Carlo Rovelli che ha preso posizione a sostegno delle mobilitazioni degli studenti che chiedono la sospensione della collaborazione tra le università italiane e le istituzioni israeliane. Qui di seguito il testo dell’intervista Carlo Rovelli, fisico teorico, autore dei bestseller di divulgazione scientifica “Sette brevi lezioni di fisica” e “L’ordine del tempo”, non è uno da giri di parole. Nemmeno quando le idee rischiano di essere impopolari. Di...

leggi tutto
Nico Maccentelli: Questioni ideologiche

Information
08 April 2024 478 hit(s)

Riporto questo articolo di Xi Jinping uscito ieri sul L’Antiplomatico, che conferma quanto ho avuto modo di analizzare in un mio contributo apparso si Carmilla e ripreso da Sinistrainrete poche settimane or sono. Non starò a ripetermi in queste sede e in estrema sintesi, mi limito a ribadire che quello cinese non è socialismo, ma nell’ambito di un processo internazionale multipolare occorre sostenere tutte le forze e i paesi che vanno in quella direzione e che di fatto contribuiscono al declino storico e generale dell’imperialismo atlantista,...

leggi tutto
Claudio Canal: Clic senza frontiere: cosa c’è alla base dell’intelligenza artificiale

Information
08 April 2024 409 hit(s)

Mi scuso con chi legge questo articolo perché era mia intenzione aprire alla grande con una congrua citazione marxiana dai Grundrisse, quella che si avvia con: «Der Krieg ist daher eine…». Poi ho assistito in TV a una pensosa trasmissione condotta dal noto filosofo con nome primaverile, Fiorello, e ho cambiato idea. Il pensatore ha introdotto la categoria post-postmoderna di Ignoranza Artificiale. A questo punto ho meditato. Grande LLM di GPR-3! Grandissimo PaLM-2 che è addestrato da 340 miliardi di parametri! Grandioso GPT-4 addestrato da un...

leggi tutto
Matteo Bortolon: Skynet sta arrivando, ma a fin di bene

Information
08 April 2024 358 hit(s)

Terminata la lettura delle scarse 150 pp. del volume di Stefano Isola, A fin di bene: il nuovo potere della ragione artificiale (Asterios, 2023), la sensazione è di inquietudine. Il dibattito sulle potenzialità della cosiddetta “intelligenza artificiale” (AI) è salito al punto da echeggiare i temi della fantascienza sulla “rivolta delle macchine”. Impressiona il fatto che la denuncia dei rischi venga non da qualche sorta di “primitivista”, ma da imprenditori del settore e da ricercatori. “Il 49% dei ricercatori di intelligenza artificiale ha...

leggi tutto
Pasquale Vecchiarelli: Aspetti materialistici della guerra in Ucraina

Information
07 April 2024 554 hit(s)

leggi tutto
comidad: Il "liberismo" di Milei e di Bezos, ovvero il solito socialismo per ricchi

Information
07 April 2024 426 hit(s)

Aleksandr Herzen diceva che il nichilismo non è il voler ridurre le cose a nulla, bensì riconoscere il nulla quando lo si incontra. La nulliloquenza non sarebbe difficile da individuare, dato che consiste nel muoversi costantemente su categorie astratte senza mai scendere nel dettaglio concreto. Purtroppo a volte è sufficiente drammatizzare la mistificazione nel modo giusto per far cascare l’uditorio nell’illusione. Nel gennaio scorso ci hanno raccontato la fiaba sul liberista, “libertario” e “anarco-capitalista” Xavier Milei, neo-presidente...

leggi tutto
Fabrizio Marchi: Ilaria Salis. Le reali questioni politiche dietro la rappresentazione mediatica

Information
07 April 2024 550 hit(s)

Ieri sera nel salotto di Floris il padre di Ilaria Salis ha pronunciato le seguenti parole: “Mia figlia è in carcere perché è una donna, perché è antifascista e perché non è ungherese”. Ora, un padre direbbe e farebbe di tutto pur di tirar fuori la propria figlia dalla galera, e questo ci sta tutto ed è ciò che lo nobilita. Dopo di che se crede o meno in ciò che dice o sia solo una escamotage per aiutare la figlia non lo sappiamo perché non siamo nella sua testa e, tutto sommato, è anche irrilevante saperlo. Chiarito questo, lo spropositato...

leggi tutto
Il Chimico Scettico: Il caos in prima serata

Information
07 April 2024 504 hit(s)

In prima serata per modo di dire, ovviamente. Come diceva qualcuno, se campi abbastanza ne vedi di tutte le specie. Aggiungerei che finisci per vedere tutto e il contrario di tutto. Esce su Netflix Il problema dei tre corpi e improvvisamente tutti parlano di caos deterministico, il che è molto curioso ai miei occhi. È molto curioso perché mi ricordo molto bene di quando iniziai a parlare di teorie del caos. Fu nel 2016 e il partito de lascienza ci mise poco a classificare la cosa: "le teorie del caos sono un marker dell'antivaccinismo". Mi...

leggi tutto
Michael Von der Schulenburg: Fa discutere il piano di pace dei quattro tedeschi

Information
06 April 2024 516 hit(s)

Quattro autorevoli personalità tedesche – Peter Brandt, storico e figlio del cancelliere Willy Brandt, il politologo Hajo Funke, il generale in pensione Harald Kujat e Horst Teltschik, già consigliere del cancelliere Helmut Kohl – hanno presentato un piano di pace (qui il testo tradotto) altamente competente e realistico su come si potrebbe porre fine alla guerra in Ucraina attraverso un cessate il fuoco e successivi negoziati di pace. Si tratta probabilmente della proposta di pace più completa e innovativa che sia stata avanzata da un...

leggi tutto
Jafar Salimov: Bravo maestro Zelenskyj: la propaganda ucraina ha raggiunto un livello hollywoodiano

Information
06 April 2024 447 hit(s)

Quando il conflitto in Ucraina passerà alla storia, le passioni si placheranno e gli storici professionisti inizieranno ad analizzare gli eventi del recente passato, rimarremo tutti scioccati: come è potuto accadere che abbiamo accettato per oro colato un'ovvia menzogna? È consuetudine ironizzare sul passato di Vladimir Zelenskyj nel mondo dello spettacolo, ricordando come simulava suonare il pianoforte con i genitali per il divertimento del pubblico. C'erano altre battute di basso livello nel suo repertorio. Ma questo fu l’inizio, e...

leggi tutto
Diego Giachetti: Come e perché scoppiano le guerre

Information
06 April 2024 438 hit(s)

Il libro di Giorgio Monasterolo, Ucraina, Europa mondo. Guerra e lotta per l’egemonia mondiale, pubblicato dalla casa editrice Asterios (2024), affronta l’argomento guerra in Ucraina e quella fra Israele e palestinesi della striscia di Gaza rispondendo contemporaneamente a due domande: come scoppiano i conflitti militari e perché. E’ opportuno, sostiene, spostare l’attenzione dal “come”, dalla logica aggressore-aggredito – secondo la quale la guerra ucraina è iniziata nel 2022, con l’attacco russo e quella di Gaza nell’ottobre 2023 con il...

leggi tutto
Alberto Giovanni Biuso: Sorvegliare e punire nel XXI secolo

Information
06 April 2024 351 hit(s)

«Indipendentemente dalla volontà degli uomini e delle autorità che li dirigono», scrive Fernand Braudel, i fenomeni collettivi si generano, accadono, tramontano, mutano (Civiltà materiale, economia e capitalismo (secoli XV-XVIII), vol. III, I tempi del mondo, trad. di C. Vivanti, Einaudi, Torino 1982, p. 65). Una volta avviate, le dinamiche sociali e politiche vivono di vita propria, seguendo regole certo non rigide come quelle che guidano il mondo fisico ma molto forti e a volte assai simili ai principi che sottendono le trasformazioni...

leggi tutto
Andrea Baranes: Fondi speculativi del terzo tipo

Information
05 April 2024 309 hit(s)

Dall’intelligenza artificiale allo sfruttamento dei satelliti. Dai dati sul traffico marittimo alle operazioni di compravendita che si chiudono in millesimi di secondo. Vale tutto sui mercati finanziari, pur di vincere la gara. Arrivare per primi, avere le informazioni una frazione di istante prima degli altri. Essere i più veloci a realizzare qualsiasi operazione di acquisto o vendita. Secondo un recente articolo di Les Echos alcuni fondi analizzano le foto satellitari dei porti per monitorare il numero di container in attesa. L’analisi di...

leggi tutto
Kit Klarenberg: Come la CIA e l’MI6 hanno creato l’ISIS

Information
05 April 2024 645 hit(s)

Dopo sole 24 ore dall’orribile eccidio del 22 marzo al Crocus City Hall di Mosca, che ha provocato la morte di almeno 137 persone innocenti e il ferimento di altre 60, i funzionari statunitensi avevano attribuito la responsabilità del massacro all’ISIS-K, la branca di Daesh dell’Asia centro-meridionale. Per molti, la rapidità dell’attribuzione aveva sollevato il sospetto che Washington stesse attivamente cercando di spostare l’attenzione dell’opinione pubblica occidentale e del governo russo dai veri colpevoli – l’Ucraina e/o la Gran...

leggi tutto

Siti consigliati

Aldo Giannuli

Antiper

Antropocene

Antonio Mazzeo blog

Asimmetrie

Blackblog francosenia

Cambia il mondo

Campo antimperialista

Carmilla

Centro studi e iniziative - redistribuire il lavoro

Charta Sporca

Clash City Workers

Comedonchisciotte

Comidad

CommonWare

Connessioni

Contraversus

Sconnessioni precarie

Consecutio Rerum

La Contraddizione

Controlacrisi

Contropiano

Coordinamenta

Critica Impura

Domenico Losurdo

Doppio zero

*Economia e politica

Economisti di classe

Effimera

Emiliano Brancaccio

Eschaton

Euronomade

Fabionews

Faremondo

Giap/Wu Ming Foundation

Giornalismo partecipativo

Global Project

Goofynomics

Gramsci Oggi

Homolaicus

il lato cattivo

Il rasoio di Occam

ilsimplicissimus

Immateriali resistenti

Infoaut

Kelebek blog

La città futura

La città invisibile

Libera tv

L'Anatra di Vaucanson

L'Interferenza

La Riscossa

Lo Straniero

Mainstream

Marx XXI

Megachip

MicroMega

Militant

Minima&Moralia

Mondo Cane

Nazione Indiana

Nigrizia

Nostromo

Notav.info

Orizzonte48

Paginauno

Le parole e le cose

Pierluigi Fagan

Poliscritture

Politica&EconomiaBlog

Pop Off

Pro/versi - Opinioni a confronto

Quaderni di san Precario

Quiete o tempesta

Sbilanciamoci.info

Senza Soste

Sollevazione

The Walking Debt

Tysm

Utopia Rossa

Voci dall'Estero

ZNet Italy

Statistiche

OS: Linux f
PHP: 7.4.33
MySQLi: 5.5.5-10.6.15-MariaDB-log
Time: 00:33
Caching: Enabled
Gzip: Enabled
Users: 1
Articles: 27702
Articles View Hits: 54730202

contatore visite

45124235

Today

Yesterday

This Week

This Month

Last Month

All days

1827

26726

59487

656628

969665

45124235

Your IP: 5.88.236.167

2024-04-24 00:33

Visitors Counter

Details: Published: 27 March 2023; Created: 23 February 2023; Hits: 1224

Sui pericoli dei pappagalli stocastici: i modelli linguistici possono essere troppo grandi?

di Bender, Gebru, McMillan-Major, Shmitchell*

L’intelligenza artificiale è intelligente? L’analisi tecnica del funzionamento dei modelli linguistici svela cosa abbiamo davanti: nulla più di pappagalli stocastici. Uno studio dall’interno della Silicon Valley

Lanciato a novembre 2022, la chatbot ChatGPT ha acceso il dibattito sulle capacità raggiunte dall’intelligenza artificiale e sulle relative implicazioni sociali e politiche. ChatGPT è di fatto un modello linguistico (LM) di grandi dimensioni, addestrato su set di dati raccolti nel web. Un aspetto ormai noto è la dinamica con cui la IA riproduce pregiudizi, stereotipi e narrazioni dominanti, meno diffusa è la consapevolezza di che cosa siano i modelli linguistici e se, e con quale significato, possano dirsi ‘intelligenti’. È una questione fondamentale per comprendere cosa abbiamo davanti.

Lo studio di cui pubblichiamo qui un estratto esce nel marzo 2021 a firma, tra le altre, di Melanie Mitchell - accademica, si occupa di sistemi complessi, intelligenza artificiale e scienze cognitive (qui con lo pseudonimo Shmargaret Shmitchell), ha guidato il team di Google sull’etica nella IA, e la pubblicazione di questo paper le è valso il licenziamento -; lo studio ricostruisce tecnicamente i meccanismi per cui un LM può produrre un testo apparentemente fluido e coerente, ma la macchina che lo genera non ha alcun grado di comprensione: “La nostra percezione del testo in linguaggio naturale, indipendentemente da come è stato generato, è mediata dalla nostra competenza linguistica, e dalla nostra predisposizione a interpretare gli atti comunicativi come veicolanti un significato e un intento coerenti, indipendentemente dal fatto che tali atti lo abbiano. Il problema è che se un lato della comunicazione non ha significato, allora la comprensione del significato implicito è una illusione derivante dalla nostra singolare umana comprensione del linguaggio. Contrariamente a quanto può sembrare quando osserviamo il suo output, un modello linguistico è un sistema per riassemblare insieme in modo casuale sequenze di forme linguistiche che ha osservato nei suoi vasti dati di addestramento, in base a informazioni probabilistiche su come si combinano, ma senza alcun riferimento al significato: un pappagallo stocastico”.

* * * *

Introduzione

Una delle maggiori tendenze nell’elaborazione del linguaggio naturale (PNL) è stata l’aumento delle dimensioni dei modelli linguistici (Language Models, LM), misurati dal numero di parametri e dalla dimensione dei dati di addestramento. Dal 2018 abbiamo visto l’emergere di BERT (1) e delle sue varianti GPT- 2 e GPT-3 (prodotte da OpenAI, rispettivamente nel 2019 e nel 2020, n.d.a.), T-NLG (creato da Microsoft nel 2020, N.d.A.) e, più recentemente, Switch-C (prodotto da Google nel 2021, N.d.A.), con aziende apparentemente in competizione per produrre LM sempre più grandi. Mentre lo studio delle proprietà degli LM e di come cambiano con le dimensioni riveste un interesse scientifico, e i grandi LM hanno mostrato miglioramenti in vari compiti, ci chiediamo se si sia riflettuto a sufficienza sui potenziali rischi associati al loro sviluppo, e sulle strategie per mitigarli.

Consideriamo innanzitutto i rischi ambientali. Facendo eco a una linea di lavoro recente che delinea i costi ambientali e finanziari dei sistemi di deep learning, incoraggiamo la comunità di ricerca a dare la priorità a questi impatti. Un modo per farlo è riportare i costi e valutare i lavori in base alla quantità di risorse che consumano. Come delineiamo nel capitolo 3, l’aumento dei costi ambientali e finanziari di questi modelli punisce doppiamente le comunità emarginate, che hanno meno probabilità di beneficiare dei progressi raggiunti dai grandi LM e maggiori probabilità di essere danneggiate dalle conseguenze ambientali negative del loro consumo di risorse. Vista la dimensione di ciò che stiamo discutendo (delineata nel capitolo 2), la prima considerazione dovrebbe essere il costo ambientale.

Proprio come l’impatto ambientale cresce con le dimensioni del modello, così la difficoltà di capire cosa c’è nei dati di addestramento. Nel capitolo 4 discutiamo di come grandi insiemi di dati basati su testi presi da Internet, sovra-rappresentino punti di vista egemonici e codifichino pregiudizi potenzialmente dannosi per le popolazioni emarginate. Nella raccolta di set di dati sempre più grandi rischiamo di incorrere in debiti di documentazione. Raccomandiamo di mitigare questi rischi mettendo a budget, all’inizio di un progetto, la cura e la documentazione, e creando solo set di dati della dimensione che può renderli sufficientemente documentati.

Come sostenuto da Bender e Koller, è importante comprendere i limiti degli LM e contestualizzare il loro successo. Questo non solo aiuta a ridurre la pubblicità che può fuorviare il pubblico, e gli stessi ricercatori, riguardo alle capacità di questi LM, ma potrebbe incoraggiare nuove direzioni di ricerca, che non dipendono necessariamente dall’avere LM più grandi. Come discutiamo nel capitolo 5, i modelli linguistici non eseguono la comprensione del linguaggio naturale, e hanno successo solo in compiti che possono essere affrontati manipolando la forma linguistica. Concentrarsi sui risultati all’avanguardia nelle classifiche, senza incoraggiare una comprensione più approfondita del meccanismo con cui tali successi vengono raggiunti, può causare risultati fuorvianti, e dirigere le risorse lontano dagli sforzi che faciliterebbero il progresso a lungo termine verso la comprensione del linguaggio naturale, senza utilizzare dati di addestramento insondabili.

Inoltre, la tendenza degli interlocutori umani ad attribuire un significato dove non c’è, può indurre in errore sia i ricercatori di PNL che il pubblico utilizzatore, portati a considerare significativo il testo artificiale. Una situazione che diviene ancora più dannosa in combinazione con la capacità degli LM di contenere, nei dati di addestramento, sia pregiudizi sottili che forme apertamente offensive, linguaggio dispregiativo e una discriminazione che, attraverso interazioni con il linguaggio artificiale, può essere rafforzata all’interno della società. Esploriamo questi potenziali danni nel capitolo 6 e i potenziali percorsi da seguire nel capitolo 7.

Ci auguriamo che una panoramica critica dei rischi insiti nell’affidar- si, come motore principale per l’aumento delle prestazioni della tecnologia linguistica, a dimensioni sempre crescenti di LM, possa facilitare una riallocazione degli sforzi verso approcci che evitino alcuni di questi rischi, pur continuando a raccogliere i benefici dei miglioramenti.

Background

Con il termine modello linguistico intendiamo fare riferimento a sistemi addestrati su attività di predizione di stringhe: ovvero, sistemi che prevedono la probabilità di un token (carattere, parola o stringa) dato il contesto precedente o, in LM bidirezionali e mascherati, dato il contesto circostante. Tali sistemi non sono supervisionati e, una volta implementati, accettano un testo come input, generando comunemente punteggi o previsioni di stringhe.

Tabella 1. Panoramica dei recenti modelli linguistici di grandi dimensioni

Year	Model	# of Parameters	Dataset Size
2019	BERT [39]	3.4E+08	16GB
2019	DistilBERT [113]	6.60E+07	16GB
2019	ALBERT [70]	2.23E+08	16GB
2019	XLNet (Large) [150]	3.40E+08	126GB
2020	ERNIE-Gen (Large) [145]	3.40E+08	16GB
2019	RoBERTa (Large) [74]	3.55E+08	161GB
2019	MegatronLM [122]	8.30E+09	174GB
2020	T5-11B [107]	1.10E+10	745GB
2020	T-NLG [112]	1.70E+10	174GB
2020	GPT-3 [25]	1.75E+11	570GB
2020	GShard [73]	6.00E+11	-
2021	Switch-C [43]	1.57E+12	745GB

Inizialmente proposti da Shannon nel 1949, alcuni dei primi LM risalgono a inizio anni ‘80, e sono stati utilizzati come componenti nei sistemi per il riconoscimento vocale automatico (Automatic Speech Re- cognition, ASR), per la traduzione automatica (Machine Translation, MT), per la classificazione dei documenti, e altro ancora. In questo capitolo, forniamo una breve panoramica della tendenza generale della modellazione del linguaggio negli ultimi anni. [...]

Gli attuali modelli Transformer (2) sono stati in grado di beneficiare di architetture sempre più grandi e di sempre maggiori quantità di dati. [.] La Tabella 1 riassume una selezione di questi LM in termini di dimensioni e parametri dei dati di addestramento. Man mano che quantità sempre maggiori di testo vengono raccolte in Internet e riunite in set di dati come Colossal Clean Crawled Corpus e Pile (3), è prevedibile che, fino a quando sarà correlata a un aumento della prestazione, continuerà la tendenza verso LM sempre più grandi. [...]

Il passaggio dai primi LM a quelli attuali - dai modelli n-grammi, ai vettori di parole derivati da LM neurali, ai Transformer pre-addestrati di oggi - è accompagnato da un’espansione e da un cambiamento nei tipi di compiti per i quali hanno una utilità. Inizialmente LM n-grammi erano tipicamente impiegati nella selezione degli output, per esempio, di modelli acustici o di traduzione; i vettori di parole derivati da LSTM sono stati rapidamente utilizzati per una varietà di attività di PNL che coinvolgono etichettatura e classificazione, per la loro più efficace ‘rappresentazione’ delle parole (al posto della caratteristica ‘molte parole’); infine, gli attuali modelli Transformer pre-addestrati possono essere riaddestrati su dataset molto piccoli, per eseguire compiti di apparente manipolazione del significato come fare un riepilogo, rispondere a una domanda e simili (come ChatGPT, n.d.a.). Tuttavia, tutti questi modelli condividono la proprietà di essere LM nel significato che abbiamo dato, ossia sistemi addestrati a prevedere sequenze di parole (o di caratteri o di frasi). Differiscono nella dimensione dei set di dati di addestramento che utilizzano, e nelle sfere di influenza su cui possono eventualmente agire. Questo fa sì che gli attuali LM, molto grandi, incorrano in nuove tipologie di rischio, che analizziamo nei capitoli seguenti.

Costo ambientale e finanziario

Strubell et al. (2019) hanno recentemente confrontato i costi di addestramento e sviluppo del modello Transformer in termini di dollari ed emissioni stimate di CO2. Mentre l’essere umano medio è responsabile di circa 5 tonnellate di CO2 per anno, gli autori hanno formato un grande modello Transformer [.] e hanno stimato che tale procedura ha emesso 284 tonnellate di CO2. Si stima che l’addestramento di un singolo modello base BERT su GPU (senza messa a punto dell’iperparametro) richieda la stessa energia di un volo transamericano.

Sebbene parte di questa energia provenga da fonti rinnovabili o dall’uso, da parte delle società di cloud computing, di fonti di compensazione dei crediti di carbonio, gli autori osservano che la maggior parte dell’energia dei fornitori di cloud computing non proviene da fonti rinnovabili, e che molte fonti energetiche nel mondo non sono a emissioni zero. Inoltre, le fonti energetiche rinnovabili sono ancora costose per l’ambiente, e i data center con crescenti requisiti di calcolo tolgono energia verde ad altri potenziali usi. Gli autori sottolineano dunque la necessità di modelli di architetture e di paradigmi di addestramento ad alta efficienza energetica.

Strubell et al. esaminano anche il costo dei modelli, rispetto ai loro guadagni in precisione. [...] La quantità di calcolo utilizzata per addestrare i più grandi modelli di deep learning (per NLP e altre applicazioni) è aumentata di 300.000 volte in sei anni [.].

Quando eseguiamo analisi di rischio/beneficio della tecnologia linguistica, dobbiamo tenere presente il modo in cui i rischi e i benefici sono distribuiti, perché non si accumulano sulle stesse persone. Da un lato, è ben documentato nella letteratura sul razzismo ambientale, che gli effetti negativi del cambiamento climatico stanno raggiungendo e colpendo per prime le comunità più emarginate del mondo. È giusto chiedere, per esempio, che i residenti delle Maldive (probabilmente sott’acqua entro il 2100) o le 800.000 persone in Sudan colpite da drastiche alluvioni, debbano pagare il prezzo ambientale della formazione e del dispiegamento di LM inglesi sempre più grandi, quando simili modelli su larga scala non vengono prodotti per Dhivehi o per l’arabo sudanese?

Mentre alcune tecnologie linguistiche sono realmente progettate per avvantaggiare le comunità emarginate, la maggior parte è costruita per soddisfare le esigenze di coloro che nella società hanno già i maggiori privilegi. Consideriamo, per esempio, chi è probabile abbia le risorse finanziarie per acquistare Google Home, Amazon Alexa o un dispositivo Apple con Siri installato, e abbia anche una buona conoscenza di una lingua che il dispositivo è programmato per utilizzare. Inoltre, quando i grandi LM codificano e rafforzano i pregiudizi egemonici (vedere i capitoli 4 e 6), è più probabile che i danni che ne conseguono ricadano sulle popolazioni emarginate le quali, anche nelle nazioni ricche, hanno maggiori probabilità di sperimentare il razzismo ambientale. [.]

È giunto il momento che i ricercatori diano la priorità all’efficienza energetica e ai costi per ridurre l’impatto ambientale negativo e l’accesso iniquo alle risorse, che colpiscono in modo sproporzionato le persone che si trovano già in posizioni emarginate.

Dati di addestramento insondabili

La dimensione dei dati disponibili sul web, ha consentito ai modelli di deep learning di ottenere un’elevata precisione su benchmark specifici nelle applicazioni di PNL e visione artificiale. Tuttavia, in entrambe le aree di applicazione, i dati di addestramento hanno dimostrato di avere caratteristiche problematiche, creando modelli che codificano associazioni stereotipate e dispregiative di genere, razza, etnia e stato di disabilità. In questo capitolo discutiamo di come grandi dataset, non curati e basati su Internet, codifichino la visione dominante/egemonica che danneggia ulteriormente le persone ai margini, e raccomandiamo un’allocazione significativa delle risorse verso la cura del set di dati e le pratiche di documentazione.

Le dimensioni non garantiscono la diversità

Internet è uno spazio virtuale ampio e diversificato e, di conseguenza, è facile immaginare che set di dati molto grandi, come Common Crawl (“petabyte di dati raccolti in otto anni di web crawling”, una versione filtrata dei quali è inclusa nei dati di addestramento di GPT-3. Vedi nota 3, n.d.a.), sia ampiamente rappresentativo dei modi in cui le diverse persone vedono il mondo. Tuttavia, a un esame più attento, troviamo che ci sono diversi fattori che limitano la partecipazione a Internet, che limitano le discussioni che vengono incluse attraverso la metodologia di crawling e che limitano, infine, i testi che possono essere utilizzati dopo che i dati scansionati sono stati filtrati; in tutti i casi, è anche più probabile che vengano mantenute le voci delle persone che più aderiscono a un punto di vista egemonico. Nell’inglese statunitense e britannico, ciò significa che nei dati di addestramento le opinioni suprematiste bianche, misogine, generazionali ecc. sono sovra-rappre- sentate, non solo superando la loro prevalenza nella popolazione generale, ma anche facendo sì che i modelli addestrati su questi dataset amplifichino ulteriormente pregiudizi e danni.

A partire da chi contribuisce a queste raccolte di testi su Internet, vediamo che l’accesso stesso al web non è distribuito uniformemente, con il risultato che i dati sovra-rappresentano gli utenti più giovani e quelli dei Paesi sviluppati. Tuttavia, non è solo il web nel suo insieme a essere in questione, ma piuttosto suoi sotto-campioni specifici. Per esempio, i dati di addestramento di GPT-2 provengono dallo scraping di collegamenti in uscita da Reddit, e un sondaggio del 2016 del Pew Internet Research rivela che il 67% degli utenti di Reddit negli Stati Uniti sono uomini, e il 64% di età compresa tra 18 e 29 anni. Allo stesso modo, recenti sondaggi sui wikipediani rilevano che solo l’8,8-15% sono donne o ragazze.

Inoltre, mentre i siti di contenuti generati dagli utenti come Reddit, Twitter e Wikipedia si presentano come aperti e accessibili a chiunque, ci sono fattori strutturali, tra cui pratiche di moderazione, che li rendono meno accoglienti per le popolazioni emarginate. Sono documentati numerosi casi (utilizzando tecniche di etnografia digitale) in cui le persone che hanno ricevuto minacce di morte su Twitter hanno avuto i loro account sospesi, al contrario di quelli che hanno emesso le minacce di morte; inoltre le molestie sono subite da un’ampia gamma di gruppi sovrapposti tra cui vittime di abusi domestici, prostitute, persone trans, persone queer, immigrati, pazienti di medici (dai loro fornitori), persone neurodivergenti e persone visibilmente o mentalmente disabili. Il risultato è che un insieme limitato di sotto-popolazioni può continuare ad aggiungere facilmente dati, condividere i propri pensieri e sviluppare piattaforme che includano le proprie visioni del mondo. [...]

Anche se le popolazioni che si sentono sgradite nei siti tradizionali istituiscono diversi forum per la comunicazione, è meno probabile che questi vengano inclusi nei dati di addestramento per i modelli linguistici. Prendiamo, per esempio, gli anziani negli Stati Uniti e nel Regno Unito. Entrambi i gruppi articolano individualmente e collettivamente fra- me anti-età specificatamente attraverso blog [.]. Questi forum contengono ricche discussioni su ciò che costituisce la discriminazione basata sull’età e sui relativi impatti. Tuttavia, una comunità di blog come quella descritta da Lazar et al. è meno probabile che venga trovata e inserita nel set di dati, rispetto ad altri blog che hanno più link in entrata e in uscita.

Infine, l’attuale pratica di filtrare i dataset può attenuare ulteriormente le voci delle persone provenienti da identità emarginate. Il set di addestramento per GPT-3 era una versione filtrata di Common Crawl, sviluppato formando un classificatore per selezionare i documenti più simili a quelli utilizzati nei dati di addestramento di GPT-2 - ovvero documenti linkati da Reddit, più Wikipedia e una raccolta di libri. Mentre, secondo quanto riferito, è stato efficace nel filtrare i documenti che il lavoro precedente aveva definito “incomprensibili”, ciò che non viene misurato (e quindi non si conosce) è quanto altro viene filtrato. Il Colossal Clean Crawled Corpus (vedi nota 3, n.d.a.), utilizzato per addestrare un trilione di parametri LM, viene ripulito, tra l’altro, scartando qualsiasi pagina contenente un termine presente in una lista di circa 400 “parole sporche, cattive, oscene o diversamente cattive”. L’elenco è prevalentemente formato da termini legati al sesso, con una manciata di insulti razzisti e vocaboli relativi alla supremazia bianca (per esempio svastica, potere bianco). Sebbene probabilmente efficace nel rimuovere documenti contenenti pornografia (e gli associati stereotipi problematici codificati nel linguaggio di tali siti) e alcuni tipi di incitamento all’odio, questo approccio indubbiamente attenuerà anche l’influenza degli spazi online costruiti da e per le persone LGBTQ, sopprimendo parole come twink. Se filtriamo il discorso delle popolazioni emarginate, non riusciamo a fornire dati di addestramento che recuperano gli insulti e che descrivano in altro modo, in una luce positiva, le stesse identità emarginate.

Così a ogni passo, dalla partecipazione iniziale ai forum Internet, alla presenza continua, alla raccolta e infine al filtraggio dei dati di addestramento, la pratica corrente privilegia il punto di vista egemonico. Accettando grandi quantità di testo web come ‘rappresentative’ di ‘tutta’ l’umanità, rischiamo di perpetuare punti di vista dominanti, aumentare gli squilibri di potere e replicare ulteriormente la disuguaglianza. [...]

Dati statici/Modifica delle visualizzazioni social

Un aspetto centrale della formazione dei movimenti sociali implica l’uso strategico del linguaggio per destabilizzare le narrazioni dominanti, e richiamare l’attenzione su prospettive sociali sotto-rappresentate. I movimenti producono nuove norme, nuovi linguaggio e nuovi modi di comunicare. Questo aggiunge sfide all’implementazione LM, poiché le metodologie che vi dipendono corrono il rischio di un “blocco del valore”, nel quale la tecnologia replica le conoscenze più vecchie e meno inclusive.

Per esempio, il movimento Black Lives Matter ha influenzato la generazione e la modifica di articoli di Wikipedia in modo tale che, con la crescita del movimento, gli articoli che informavano sulle sparatorie di persone di colore hanno aumentato la loro copertura, e sono stati pubblicati con una latenza ridotta. È importante sottolineare che gli articoli che descrivevano le sparatorie passate e gli episodi di brutalità della polizia sono stati creati e aggiornati man mano che venivano scritti gli articoli sui fatti nuovi, mostrando come i movimenti sociali stabiliscano connessioni temporali tra gli eventi, per formare narrazioni coese. Più in generale, Twyman et al. evidenziano come i movimenti influenzino attivamente le inquadrature e le riformulazioni delle narrazioni minoritarie, nel tipo di discorso online che potenzialmente forma i dati che sono alla base degli LM.

Un avvertimento importante è che i movimenti scarsamente documentati, e che non ricevono un’attenzione significativa da parte dei media, non verranno catturati affatto. La copertura mediatica può non coprire eventi di protesta e movimenti sociali, e può distorcere avvenimenti che sfidano il potere statale. Ciò è esemplificato dai media che tendono a ignorare l’attività di protesta pacifica e si concentrano invece su eventi drammatici o violenti, un’ottima occasione per la televisione ma quasi sempre si traducono in una copertura critica. Di conseguenza, i dati alla base degli LM rappresentano in modo errato i movimenti sociali e si allineano in modo sproporzionato con i regimi di potere esistenti. [.]

Bias di codifica

È ormai noto che i grandi LM mostrano vari tipi di pregiudizi, comprese associazioni stereotipate o sentimenti negativi nei confronti di gruppi specifici. [...] Molti studi concludono che questi problemi riflettono le caratteristiche dei dati di addestramento. [...]

Cura, documentazione e responsabilità

In sintesi, LM addestrati su grandi dataset, non curati, statici e provenienti dal web, codificano visioni egemoniche che sono dannose per le popolazioni emarginate. Sottolineiamo quindi la necessità di investire risorse significative nella cura e nella documentazione dei dati di addestramento degli LM. [.]

Quando ci affidiamo a set di dati sempre più grandi rischiamo di incorrere nel debito di documentazione, ossia di metterci nella situazione in cui i set di dati sono sia non documentati che troppo grandi per essere documentati a posteriori. Mentre la documentazione consente una potenziale responsabilità, i dati di addestramento non documentati perpetuano il danno senza ricorso. Senza documentazione non è possibile cercare di comprendere le caratteristiche dei dati di addestramento, al fine di mitigare alcuni dei problemi evidenziati o addirittura altri, sconosciuti. La soluzione, proponiamo, è quella di preventivare la documentazione come parte dei costi pianificati per la creazione del set di dati, e raccogliere solo la quantità di dati che può essere accuratamente documentata all’interno di tale budget.

6. Pappagalli stocastici

Qui esploriamo i modi in cui i fattori esposti nei capitoli 4 e 5 - la tendenza dei dati di addestramento ingeriti da Internet a codificare visioni del mondo egemoniche, la tendenza di LM ad amplificare pregiudizi e altri problemi nei dati di addestramento, e la tendenza dei ricercatori e di altre persone a confondere i miglioramenti delle prestazioni degli LM con l’effettiva comprensione del linguaggio naturale - presentano rischi di danni nel mondo reale. Dopo aver esplorato alcuni motivi per cui gli esseri umani confondono l’output LM con un testo significativo, passiamo ai rischi e ai danni derivanti dall’implementazione di un tale modello su larga scala. Scopriamo che il mix di pregiudizi umani e linguaggio apparentemente coerente aumenta il potenziale di bias di automazione, l’uso improprio deliberato e l’amplificazione di una visione del mondo egemonica. Ci concentriamo principalmente sui casi in cui LM vengono utilizzati per generare testo, ma parleremo anche dei rischi che si presentano quando LM o word embeddings da esse derivati sono componenti di sistemi per la classificazione, per l’espansione di query o di altri compiti, o quando gli utenti possono interrogare LM per ottenere informazioni memorizzate dai loro dati di addestramento.

Coerenza nell’occhio di chi guarda

Laddove i tradizionali LM a n-grammi possono solo modellare dipendenze relativamente locali, prevedendo ogni parola data la precedente sequenza di N parole (di solito 5 o meno), i Transformer catturano finestre molto più grandi, e possono produrre un testo apparentemente non solo fluente, ma anche coerente tra i diversi paragrafi. Per esempio, McGuffie e Newhouse hanno interrogato GPT-3 con il testo [sottolineato] nella Figura 2, e GPT-3 ha prodotto il resto del testo, incluso il formato domanda/risposta. Questo esempio illustra la capacità di GPT- 3 di produrre testo coerente e in tema; l’argomento è collegato allo studio di McGuffie e Newhouse su GPT-3 nel contesto dell’estremismo [...].

Noi diciamo apparentemente coerente, perché la coerenza è negli occhi di chi guarda. La comprensione umana della coerenza deriva infatti dalla nostra capacità di riconoscere le credenze e le intenzioni degli interlocutori, all’interno del contesto. Ossia, l’uso del linguaggio umano ha luogo tra individui che condividono un terreno comune, e sono reciprocamente consapevoli della condivisione (e della sua portata); tra individui che hanno intenti comunicativi, che usano il linguaggio per trasmetterli e che mentre comunicano modellano gli stati mentali reciproci. In quanto tale, la comunicazione umana si basa sull’interpretazione del significato implicito trasmesso tra individui. Il fatto che la comunicazione uomo-uomo sia un’attività costruita congiuntamente, è più chiaramente vero nella comunicazione parlata o co-situata, ma usiamo le stesse strutture per produrre un linguaggio destinato a un pubblico non co-presente con noi (lettori, ascoltatori, osservatori a distanza nel tempo o nello spazio) e nell’interpretazione di tale linguaggio quando lo incontriamo. Ne consegue che anche quando non conosciamo le persone che hanno generato la lingua che stiamo interpretando, costruiamo un modello parziale di chi sono e dei punti in comune che pensiamo condividano con noi, e lo usiamo per interpretare le loro parole.

Il testo generato da un LM non è fondato sull’intento comunicativo, su alcun modello del mondo o su alcun modello dello stato mentale del lettore. Non può esserlo, perché i dati di addestramento non hanno mai incluso la condivisione di pensieri con un ascoltatore, né la macchina ha la capacità di farlo. Ciò può sembrare controintuitivo date le qualità sempre più fluide del testo generato automaticamente, ma dobbiamo tenere conto del fatto che la nostra percezione del testo in linguaggio naturale, indipendentemente da come è stato generato, è mediata dalla nostra competenza linguistica, e dalla nostra predisposizione a interpretare gli atti comunicativi come veicolanti un significato e un intento coerenti, indipendentemente dal fatto che tali atti lo abbiano. Il problema è che se un lato della comunicazione non ha significato, allora la comprensione del significato implicito è un’illusione derivante dalla nostra singolare umana comprensione del linguaggio. Contrariamente a quanto può sembrare quando osserviamo il suo output, un LM è un sistema per riassemblare insieme in modo casuale sequenze di forme linguistiche che ha osservato nei suoi vasti dati di addestramento, in base a informazioni probabilistiche su come si combinano, ma senza alcun riferimento al significato: un pappagallo stocastico.

Rischi e danni

La fluidità e la coerenza del surrogato LM solleva diversi rischi, proprio perché gli esseri umani sono preparati a interpretare le stringhe appartenenti alle lingue che parlano come significative, e corrispondenti all’intento comunicativo di qualche individuo o gruppo di individui, che hanno la responsabilità di ciò che viene detto. Passiamo ora agli esempi, esponendo successivamente i potenziali danni.

I primi rischi che consideriamo sono quelli che derivano dal fatto che LM assorbano la visione egemonica del mondo dai loro dati di addestramento. Quando gli esseri umani producono il linguaggio, le nostre espressioni riflettono le nostre visioni del mondo, compresi i nostri pregiudizi. Poiché le persone in posizioni di privilegio rispetto al razzismo, alla misoginia, all’abilismo ecc. tendono a essere sovra-rappresentate nei dati di addestramento per LM (come discusso nel capitolo 4), questi dati includono di conseguenza pregiudizi codificati, molti già riconosciuti come dannosi. [...] Mentre alcune delle parole più apertamente dispregiative potrebbero essere filtrate, non tutte le forme di abuso on- line sono facilmente rilevabili utilizzando le parole tabù [.]. Un LM addestrato su tali dati raccoglierà questo tipo di associazioni problematiche. Se esso produce un testo che viene generato affinché le persone lo interpretino (contrassegnato come prodotto da una IA o altro), quali rischi ne derivano? In primo luogo, prevediamo che LM che producono testo riproducano e persino amplifichino i bias nei loro input. Quindi il rischio è che le persone diffondano il testo generato da LM, il che significa più testo disponibile nel mondo che rafforza e propaga stereotipi e associazioni problematiche, sia agli umani che ai futuri LM formati su set di addestramento che hanno ingerito l’output della precedente generazione di LM. [.]

Una terza categoria di rischio coinvolge i cattivi attori che sfruttano la capacità dei grandi LM di produrre su richiesta grandi quantità di testi apparentemente coerenti su argomenti specifici, senza avere alcun interesse nella verità del testo generato. Possono esserci casi prosaici, come servizi impostati per scrivere ‘automaticamente’ tesine o interagire sui social media, nonché casi d’uso legati alla promozione dell’estremismo. [.]

Un altro rischio coinvolge la traduzione automatica (MT), e il modo in cui una maggiore fluidità dell’output cambia l’adeguatezza percepita dell’output stesso. È diverso dai casi precedenti, in quanto vi è un iniziale intento comunicativo umano, da parte dell’autore del testo nella lingua di partenza; tuttavia, i sistemi MT possono (e spesso lo fanno) produrre un output impreciso ma fluente e (di nuovo, apparentemente) coerente di per sé, per un utente che non vede il testo originale o non è in grado di comprenderlo da solo; e quando egli scambia il significato attribuito all’output MT come l’effettivo intento comunicativo dell’autore del testo originale, può derivarne un danno reale. [.]

Notiamo che i rischi associati a un testo artificiale, ma apparentemente coerente, sono profondamente connessi al fatto che tale testo può entrare nelle conversazioni senza che alcuna persona o entità ne sia responsabile. Una responsabilità che implica la veridicità, aspetto importante per situare il significato. Come scrive Maggie Nelson: “Le parole cambiano a seconda di chi le pronuncia; non esiste cura”.

8. Conclusione

Gli ultimi anni, da quando la capacità di elaborazione ha raggiunto i modelli neurali, sono stati tempi esaltanti nel mondo della PNL. Gli approcci neurali in generale, e in particolare i grandi Transformer LM, hanno rapidamente superato le classifiche su un’ampia varietà di benchmark, e ancora una volta l’adagio “there’s no data like more data”, appare vero. Può sembrare che il progresso nel settore, infatti, dipenda dalla creazione di modelli linguistici sempre più grandi (e dalla ricerca su come utilizzarli a vari fini).

In questo documento, abbiamo invitato i lettori a fare un passo indietro e a chiedersi: sono inevitabili o necessari LM sempre più grandi? Quali costi sono associati a questa direzione di ricerca, e cosa dovremmo considerare prima di intraprenderla? Il campo della PNL o il pubblico che serve hanno effettivamente bisogno di LM più grandi? Se sì, come possiamo perseguire questa direzione della ricerca mitigando i rischi associati? Se no, di cosa abbiamo invece bisogno?

Abbiamo identificato un’ampia varietà di costi e rischi associati alla corsa per LM sempre più grandi, tra cui: costi ambientali (generalmente sostenuti da coloro che non beneficiano della tecnologia risultante); costi finanziari, che a loro volta erigono barriere all’ingresso, limitando chi può contribuire a quest’area di ricerca, e le lingue che possono beneficiare delle tecniche più avanzate; costi di opportunità, poiché i ricercatori dedicano sforzi a direzioni che richiedono meno risorse; e il rischio di danni sostanziali, inclusi stereotipi, denigrazione, aumento dell’ideologia estremista e arresto illegale, se gli esseri umani incontrano un output LM apparentemente coerente e lo prendono per le parole di qualche persona o organizzazione che ha la responsabilità di ciò che viene detto.

Pertanto, invitiamo i ricercatori della PNL a soppesare attentamente questi rischi mentre perseguono questa direzione di ricerca, a considerare se i benefici superano i rischi, e a indagare gli scenari di doppio uso utilizzando le molte tecniche qui proposte [...].

* Estratto (traduzione a cura di Paginauno) dal paper On the Dangers of Stochastic Parrots: Can Language Models Be Too Big?, Emily M. Bender, Timnit Gebru, Angelina McMillan-Major, Shmargaret Shmitchell. FAccT ‘21: 2021 ACM Conference on Fairness, Accountability, and Transparency Virtual Event Canada March 3-10, 2021

Note

1) Bidirectional Encoder Representations from Transformers (BERT) è un modello di machine learning utilizzato nell’elaborazione del linguaggio naturale; è stato creato da Google, che nel 2019 ha annunciato di aver iniziato a utilizzarlo per il suo motore di ricerca. [Nota di redazione]

2) Il Transformer è un modello linguistico che può essere addestrato a leggere molte parole (una frase o un paragrafo, per esempio), a prestare attenzione a come queste parole si relazionano l’una con l’altra, e quindi a prevedere quali parole possono seguire. Nota di redazione

3) Common Crawl è un’organizzazione senza scopo di lucro che esegue periodicamente la scansione del web e rende gratuitamente disponibili i propri archivi e set di dati; Colossal Clean Crawled Corpus è un set di dati creato applicando una serie di filtri a una singola scansione di Common Crawl - filtri atti a escludere dati discriminatori, offensivi ecc. ma che, come mostra questo studio, non sono affatto sufficienti per costruire un dataset di addestramento privo di pregiudizi, bias ecc. -; anche OpenAI ha usato una versione filtrata di Common Crawl per addestrare il modello linguistico di GPT-3. Anche Pile è un dataset per modelli linguistici. [Nota di redazione]

Add comment

Daniele Burgio, Massimo Leoni e Roberto Sidoli: La guerra USA contro il primato tecnologico mondiale della Cina

2024-02-12 - Hits 2523

Carlo Rovelli: Guerra e pace. Intervista a Carlo Rovelli

2024-02-11 - Hits 2037

Andrea Zhok: Maccartismo. Su un angosciante documento del Parlamento europeo

2024-02-13 - Hits 1676

Paolo Cortesi: Programmi tv come addestramento di massa alla sottomissione

2024-02-08 - Hits 1604

Redazione: La Cina rompe gli indugi e si schiera con il popolo palestinese: “la lotta armata contro il colonialismo è un diritto!”

2024-03-02 - Hits 1552

Leonardo Mazzei: Terza guerra mondiale

2024-02-13 - Hits 1491

Francesco Schettino: Le radici valutarie del conflitto in Ucraina

2024-01-27 - Hits 1362

Ilan Pappe: È il buio prima dell'alba, ma il colonialismo di insediamento israeliano è alla fine

2024-02-17 - Hits 1339

Carlo Formenti: Libere di vendere il proprio corpo a pezzi

2024-03-12 - Hits 1297

Roberto Iannuzzi: Ucraina: colta da improvviso panico, l’Europa flirta con ipotesi futili quanto avventate

2024-03-14 - Hits 1250

Raffaele Sciortino: Stati Uniti e Cina allo scontro globale

2024-02-04 - Hits 1242

John Mearsheimer: “La lobby israeliana è potente come sempre”

2024-02-16 - Hits 1231

Piero Pagliani: Raddoppiare gli errori fatali

2024-03-03 - Hits 1225

Chris Hedges: Anche se è un genocidio, non verrà fermato

2024-01-29 - Hits 1222

Andrea Pannone: La porta delle lacrime, le risa del capitale e l'inflazione. Riflessioni amare sulla crisi del Mar Rosso

2024-02-19 - Hits 1202

Luciano Bertolotto: Credito, finanza, denaro ... fiducia

2024-03-01 - Hits 1195

Rostislav Ishchenko: Il problema russo non è sconfiggere l’Occidente ma cosa farne dopo

2024-02-29 - Hits 1138

Daniele Luttazzi: Al NYT hanno scoperto che gli “stupri di massa” erano solo propaganda

2024-02-27 - Hits 1137

Davide Carrozza: Lo strano caso del caso Moro – Parte Seconda

2024-01-26 - Hits 1116

Fabio Mini: Il pantano dell’ultimo azzardo e i trent’anni contro la Russia

2024-02-27 - Hits 1112

Stefano Levi Della Torre: La memoria della Shoah: due posizioni in conflitto

2024-01-25 - Hits 1103

Giulia Bertotto: Terza Guerra Mondiale? Attenzione al fattore “disperazione”

2024-03-27 - Hits 1034

Jeffrey Sachs: I perché di questa inutile guerra e come se ne esce

2024-03-06 - Hits 1034

Fabio Vighi: La fiducia nelle istituzioni e i dividendi di guerra

2024-02-29 - Hits 1008

Carlo Rovelli: Dissenso, élites e "anelare alla dittatura"

2024-03-06 - Hits 1002

Big Serge: Guerra russo-ucraina: l’alluvione

2024-03-07 - Hits 999

Stefania Fusero: La disabilità del male

2024-02-07 - Hits 989

Piccole Note: Ucraina. Gli Usa e la guerra decennale

2024-01-29 - Hits 989

Adam Entous e Michael Schwirtz: Come la Cia ha preso possesso dell'Ucraina golpista

2024-02-27 - Hits 984

Enrico Cattaruzza: Il male nel giardino di Höss. “Zona di interesse” di Jonathan Glazer

2024-03-05 - Hits 968

Daniele Burgio, Massimo Leoni e Roberto Sidoli: La tendenza alla guerra contro la Cina, con il pretesto di Taiwan

2023-05-17 - Hits 10764

Rivista Paginauno: Gaza, lettera aperta di 900 giornalisti: “I media non devono nascondere le ripetute atrocità di Israele. I termini corretti sono genocidio e pulizia etnica”

2023-11-11 - Hits 9937

Silvia Guerini: Chi finanzia il movimento LGBTQ

2023-06-08 - Hits 9125

Daniele Burgio, Massimo Leoni e Roberto Sidoli: Lenin con gli occhi a mandorla: l’asiacentrismo

2024-01-16 - Hits 8054

Daniele Burgio, Massimo Leoni e Roberto Sidoli: Cina: marxismo creativo invece del marxismo dogmatico

2023-07-13 - Hits 7777

Daniela Danna: Risposta alle 200 femministe che rispondono alle 100 senza nominarle, da parte della 301esima

2023-04-25 - Hits 7291

Marco Travaglio: Abbiamo abolito i neuroni

2023-05-02 - Hits 7257

Francesco Marabotti: Schiavitù di massa o Rivoluzione Politica? Una riflessione in occasione del Primo maggio

2023-05-01 - Hits 6865

Emmanuel Goût: L’Italia può diventare protagonista sullo scacchiere mondiale?

2023-04-26 - Hits 6678

Daniele Luttazzi: I (veri) motivi per cui Cia, Nsa e il Pentagono hanno creato Google

2023-04-27 - Hits 6445

Fabio Mini: La “controffensiva” è un fumetto di sangue

2023-06-14 - Hits 6300

Piccole Note: I droni sul Cremlino. Prove di terza guerra mondiale

2023-05-03 - Hits 6174

Joseph Halevi: L’inflazione è da profitti

2023-05-07 - Hits 6004

Viktor Sokirko: Prigozhin è il "contrattacco": l'ammunitamento è servito alla NATO per carpire gli schemi difensivi russi

2023-06-24 - Hits 5975

Andrew Korybko: Il tradimento di Prigozhin è inaccettabile a prescindere dall'opinione che si ha dell'operazione speciale

2023-06-24 - Hits 5537

Andrea Zhok: I quattro indizi che in occidente qualcuno lavora per il "casus belli" nucleare

2023-06-23 - Hits 5474

Wu Ming: Non è «maltempo», è malterritorio. Le colpe del disastro in Emilia-Romagna

2023-05-17 - Hits 5389

Giorgio Agamben: I media e la menzogna senza verità

2023-07-03 - Hits 5203

Nico Maccentelli: Riflessioni su una sinistra di classe che sbaglia

2023-06-25 - Hits 5041

Emmanuel Todd: «Stiamo assistendo alla caduta finale dell'Occidente»

2024-01-16 - Hits 4935

Alessandro Bartoloni Saint Omer: Oltre "destra" e "sinistra" di Andrea Zhok

2023-06-30 - Hits 4905

Alberto Fazolo: Il 24 giugno a sgretolarsi è stata la propaganda sul conflitto in Ucraina

2023-06-26 - Hits 4826

Andrea Zhok: Le liberaldemocrazie bruciano nei cassonetti

2023-06-29 - Hits 4733

Fabio Mini: Zelensky è finito intrappolato

2023-05-18 - Hits 4647

Andrea Zhok: Contro le letture di "destra" e di "sinistra" delle rivolte in Francia

2023-07-02 - Hits 4630

Alessandro Avvisato: Prigozhin in esilio. Il “golpe” finisce in “volemose bene”

2023-06-25 - Hits 4570

Fabio Mini: Quante favole in tv su cause, azioni ed effetti del “golpe”

2023-06-28 - Hits 4470

Emiliano Brancaccio: Un Esecutivo nemico del lavoro. Il fine ultimo è il precariato

2023-04-28 - Hits 4454

Guido Salerno Aletta: La Germania si ritrova sola di fronte ai prezzi impazziti

2023-07-02 - Hits 4409

Fabrizio Casari: Guerra e pace, lo strabismo europeo

2023-05-28 - Hits 4369

Qui una anteprima del libro

Qui la quarta di copertina

Qui una recensione di Terry Silvestrini

Qui una recensione di Diego Giachetti

Qui una recensione di Giovanni Di Benedetto

Qui una presentazione del libro

Qui la quarta di copertina

Qui una recensione di Ciro Schember

Qui la quarta di copertina

Qui l'introduzione

Qui l'introduzione al volume

Qui una recensione del libro

Qui la quarta di copertina

Qui una presentazione

Qui una recensione di Luigi Pandolfi

Enrico Grazzini è giornalista economico, autore di saggi di economia, già consulente strategico di impresa. Collabora e ha collaborato per molti anni a diverse testate, tra cui il Corriere della Sera, MicroMega, il Fatto Quotidiano, Social Europe, le newsletter del Financial Times sulle comunicazioni, il Mondo, Prima Comunicazione. Come consulente aziendale ha operato con primarie società internazionali e nazionali.

Ha pubblicato con Fazi Editore "Il fallimento della Moneta. Banche, Debito e Crisi. Perché bisogna emettere una Moneta Pubblica libera dal debito" (2023). Ha curato ed è co-autore dell'eBook edito da MicroMega: “Per una moneta fiscale gratuita. Come uscire dall'austerità senza spaccare l'euro" ” , 2015. Ha scritto "Manifesto per la Democrazia Economica", Castelvecchi Editore, 2014; “Il bene di tutti. L'economia della condivisione per uscire dalla crisi”, Editori Riuniti, 2011; e “L'economia della conoscenza oltre il capitalismo". Codice Edizione, 2008

Qui l'indice del libro e l'introduzione in pdf.

Qui la quarta di copertina

Qui una recensione di Giovanni Di Benedetto

Qui la quarta di copertina

Qui una recensione di Giuseppe Melillo

Qui l'introduzione di Giuseppe Sottile

Qui la quarta di copertina

Qui una presentazione del volume

Qui una breve presentazione

Qui la postfazione di Riccardo Frola e Dario Padovan

Qui la prefazione di Jacques Camatte

Qui l'intero testo in formato pdf

Qui la quarta di copertina

Qui l'introduzione

Qui una recensione di Alessandro Barile

Qui la quarta di copertina

Qui una recensione di Gianni Boccardelli

Qui la quarta di copertina

Qui le presentazioni di copertina

Qui la prefazione di Vittorio Agnoletto

Qui l'introduzione di Elisa Lello e Niccolò Bertuzzi

Vuoi iscriverti alla newsletter?

Notizie sull'operazione speciale condotta dall'esercito russo in Ucraina

A cura di Paolo Selmi

Articoli meno recenti

Siti consigliati

Statistiche

contatore visite

Sui pericoli dei pappagalli stocastici: i modelli linguistici possono essere troppo grandi?

di Bender, Gebru, McMillan-Major, Shmitchell*

Note

1) Bidirectional Encoder Representations from Transformers (BERT) è un modello di machine learning utilizzato nell’elaborazione del linguaggio naturale; è stato creato da Google, che nel 2019 ha annunciato di aver iniziato a utilizzarlo per il suo motore di ricerca. [Nota di redazione]

2) Il Transformer è un modello linguistico che può essere addestrato a leggere molte parole (una frase o un paragrafo, per esempio), a prestare attenzione a come queste parole si relazionano l’una con l’altra, e quindi a prevedere quali parole possono se­guire. Nota di redazione

Add comment

Gli articoli più letti degli ultimi tre mesi

Gli articoli più letti dell'ultimo anno

Franco Romanò, Paolo Di Marco: La dissoluzione dell'economia politica

Giorgio Monestarolo:Ucraina, Europa, mond

Andrea Cozzo: La logica della guerra nella Grecia antica

Moreno Biagioni: Se vuoi la pace prepara la pace

Angelo Calemme: La questione meridionale dall'unità d'Italia alla disintegrazione europea

André Tosel: Il ritorno del religioso

Alessandra Ciattini: Semi di un mondo futuribile

Gruppo Krisis: Manifesto contro il lavoro

Fernando Buen Abad: Guerriglia semiotica

Andrea Pannone: Che cos'è la guerra

Ascanio Bernardeschi: malascienza

Michele Castaldo: Modo di produzione e libero arbitrio

C. Pozzana e A. Russo: La quarta guerra mondiale. E noi?

Enrico Grazzini: Il fallimento della moneta

Salvatore Minolfi: Le origini della guerra russo-ucraina

Paul Mattick. Un operaio teorico del marxismo

Annibale C. Raineri: Ancora. Cambiare il mondo nel tramonto della politica

Gerardo Lisco: La democrazia sospesa

Frattura metabolica e Antropocene

Autori vari: La lingua resa

Anselm Jappe: Le avventure della merce

Karl Marx: Urtext

Prospero Gallinari: Un contadino nella metropoli

Alessandro Ghebreigziabiher: Nato da un crimine contro l'umanità

André Tosel: Un mondo nell'abisso

Femminismo: paradigma della violenza/nonviolenza

Dissenso Informato

2) Il Transformer è un modello linguistico che può essere addestrato a leggere molte parole (una frase o un paragrafo, per esempio), a prestare attenzione a come queste parole si relazionano l’una con l’altra, e quindi a prevedere quali parole possono seguire. Nota di redazione