Un dataset di scrittori sotto-rappresentati

Il Knowledge Graph degli scrittori sotto-rappresentati è un dataset di scrittori e delle loro opere, creato per studiare il problema della mancata rappresentazione online delle persone non occidentali.

Gli scrittori sono raggruppati in due gruppi: Occidentali e Transnazionali. Questa distinzione è basata su due criteri: il paese di nascita della persona, che deve essere un’ex colonia con un Indice di Sviluppo Umano alto o inferiore, oppure l’appartenenza della persona a una minoranza etnica.

Inoltre, sono state considerate per effettuare questa classificazione:

  • Il 1808, ovvero l’anno in cui sono cominciate le Guerre di Indipendenza Ispano-Americane. Questa data è una soglia per l’intero dataset, che comprende solo persone nate dal 1808 in poi. Inoltre, solo le persone nate nell’America Latina o Caraibica sono etichettate come Transnazionali.
  • Il 1917, ovvero l’anno in cui sono stati redatti i 14 punti da parte di Woodrow Wilson. Solo le persone nate in Africa e in Asia da questa data in poi sono state etichettate come Transnazionali.

Il dataset include 194,065 scrittori presenti su Wikidata e Wikipedia. Di questi, 17,368 sono categorizzati come Transnazionali, 176,697 come Occidentali

I loro libri sono categorizzati di conseguenza e sono stati scaricati da Wikidata, Open LIbrary e Goodreads. Nella tabella sottostante è possibile osservare la distribuzione dei lavori nel Knowledge Graph.

Fontelibri Occidentalilibri Transnazionali
Wikidata136,9958,380
Open Library824,37866,050
Goodreads152,46837,680
La distribuzione dei libri di autori Occidentali.
La distribuzione dei libri di autori Transnazionali.

Come esplorare il Knowledge Graph

Il Knowledge Graph è liberamente consultabile al seguente indirizzo: https://kgccc.di.unito.it/sparql/urwriters

Cliccando sui bottoni sottostanti è possibile accedere a query di ricerca già create