Funzionamento del GIS 5 / 10: Attenzione all’algoritmo !

Parte di una serie di 10 brevi post sulle funzioni e benefici per l’utente della componente di aggregazione delle notizie della piattaforma del Gruppo di Informazione Solidale (GIS, vedi FAQ qui e manifesto qui). Vedi qui per il primo con il piano di tutti i post della serie.

Noi oggi siamo sommersi dalle notizie: solo nella nostra instanza dell’aggregatore entrano 50000 articoli al mese, mentre aggregatori professionali come lo Europe Media Monitor della commissione europea o il IJS newsfeed dello Jozef Stefan Institute di Ljubljana viaggiano sui 280000 e 150000 articoli al giorno. Dominare questa mole di informazione sarebbe impossibile, se non ci aiutasse l’informatica, che nasce appunto per trattare automaticamente le informazioni ! Basta non aver paura dell’algoritmo, ma dominarlo in modo da farlo lavorare al nostro servizio, e non diventarne schiavi.

Ritorniamo sulla home page dell’aggregatore: essa appare ai soci che hanno effettuato l’accesso come una griglia di riquadri (ognuno dei quali presenta un’anteprima di alcune righe di testo da ogni articolo), e può essere sfogliata a piacimento:

Questa prima pagina è tanto facile da usare (basta far passare e cliccare …) quanto complessa e potente; essa presenta un newsfeed personalizzato per ogni utente, che non è in ordine cronologico di pubblicazione, ma viene generato da un algoritmo, come un cocktail ottenuto shakerando cinque ingredienti (viste) differenti:

  1. filtrati (4 parti)
  2. parole chiave (3 parti)
  3. suggeriti (2 parti)
  4. popolari (2 parti)
  5. ultima ora (1 parte)

Vediamo più in dettaglio queste 5 viste.

La vista filtrati non è cronologica, e usa un algoritmo di ranking simile a quello di hackernews e reddit, che cerca di mantenere visibili più a lungo gli articoli che pensa possano interessarti; questa vista può essere influenzata principalmente mediante le sue impostazioni nella pagina dedicata:

In particolare:

  • puoi chiedere solo articoli provenienti da fonti taggate con almeno uno dei tag selezionati (scelti tra: cultura, società, italia, estero, scienza_tecnica, sport, economia, blog, notiziario, rivista); se non viene scelto alcun tag, farà vedere tutti gli articoli;
  • puoi elencare le lingue in cui devono essere mostrati gli articoli; se non viene scelta alcuna lingua farà vedere tutti gli articoli, e se viene incluso l’italiano farà vedere anche gli articoli tradotti.

Un altro modo per influenzare l’algoritmo “filtrati” è dare dei voti alle fonti (positivi: da 1 a 5 stelle, o negativi: da 1 a 5 pollici versi) nella pagina con l’elenco delle fonti:

 

nel caso dell’esempio la vista filtrati cercherà di dare risalto agli articoli da Al Jazeera e Alphaville, e di far sparire in fretta quelli da Ansa e Articolo 21.

La vista preferiti invece è cronologica e mostra solo gli articoli che contengono le parole chiave indicate nel testo, o sono stati scritti dagli autori selezionati nella pagina di impostazioni dedicata:

Inserendo qui le parole chiave che si vogliono tenere d’occhio (nell’esempio: “mastodon blockchain m5s eilish”) e i propri autori preferiti (nell’esempio: “grillo travaglio”) la vista preferiti si comporta come una affidabile rassegna stampa tematica personale !

La vista suggeriti invece è quella che potrebbe soprenderti, proponendoti articoli che potrebbero interessarti. L’algoritmo li trova guardando agli articoli che hai già letto: sono “potenzialmente interessanti” gli articoli dove compaiono con frequenza significativa termini le parole che compaiono negli articoli già letti e/o votati positivamente da te.

La vista popolari è cronologica e mostra quello che stanno leggendo gli altri utenti registrati (meccanismo collaborativo di scoperta). Nota: per questa vista e la precedente non facciamo uso del grafo sociale (come fanno i social network che promuovono i post visti dai tuoi amici o che a loro sono piaciuti).

La vista ultima ora mostra solo articoli provenienti da fonti taggate come “notiziario”, non è cronologica, e usa l’algoritmo di ranking tipo-hackernews cercando di mantenere visibili più a lungo gli articoli più brevi.


Per chi ha la paranoia degli algoritmi, la buona notizia è che come vedremo nell’ultimo post della serie, la piattaforma è tutta open source quindi l’algoritmo è perfettamente trasparente. Quindi chi mastica il Python può andare a vedere il codice che c’è dietro.

Se no si può cercare di vederci chiaro in modo empirico, guardando separatamente alle 5 viste che l’algoritmo mixa, selezionando “viste” dalla barra in alto, e poi cambiando vista con il menù a tendina:

Tra l’altro in questa tendina, oltre alle 5 viste che contribuiscono alla prima pagina, ce ne sono altre 5:

  1. cronologia: gli articoli già letti dall’utente;
  2. premium: ne parleremo nell’ottavo post;
  3. in lingua: solo articoli in lingue diverse dall’italiano, in ordine cronologico;
  4. nascosti: raccoglie gli articoli che l’utente per motivi suoi non desidera né leggere né vedere;
  5. interessanti: raccoglie gli articoli che l’utente ha marcato come interessanti dal newsfeed, dalla pagina di ricerca o dalla vista di dettaglio dell’articolo, cliccando sul bottone  con l’icona del carrello.

Ecco come funziona la vista “nascosti”; gli articoli possono essere nascosti con lo swipe nelle liste, oppure cliccando sul bottone con l’icona del cestino:

questa funzione non implica un giudizio di valore sugli articoli, e non ha effetti sugli altri utenti (è utile ad esempio per toglierti di mezzo cose che l’algoritmo ti propone troppo insistentemente).

La vista interessanti raccoglie tutti gli articoli che sono stati da te precentemente segnati come interessanti cliccando sull’icona del “carrello”. Questa funzione è molto utile se si sfogliano gli elenchi notizie nei ritagli di tempo, e si vede qualcosa che si vorrebbe leggere ma è troppo lungo o troppo impegnativo: in tal caso, clicca sul bottone del carrello! La lista degli articoli interessanti viene salvata nella nuvola (!) quindi gli articoli segnati come interessanti sul telefono o sul computer durante la settimana potranno essere letti con calma sul tablet o sull’ebook reader nel fine settimana.

In pratica funziona così:

Nel post precedente abbiamo visto che si possono scaricare o farsi mandare via email singoli articoli; questo è possibile anche per un gruppo di articoli, usando appunto la vista interessanti. Ecco un demo con scaricamento dell’estratto con quattro articoli in formato pdf:

Se siete arrivati a leggere fin qui, vi meritate la foto di un gatto !

Post precedente: 4. Lettura offline e newsletter

Post successivo: 6. Segnalazioni e voti