Il contributo presenta una ricerca, tuttora in corso, di raccolta e analisi del corpus IncluInstIT, composto da forme di linguaggio inclusivo di genere presenti nella piattaforma social Instagram. Il corpus è stato elaborato attraverso metodologie semiautomatiche sia durante la fase di iniziale di raccolta dei post per la creazione del dataset, che nel successivo trattamento dei dati scaricati per selezionare i post pertinenti alla ricerca e rendere tutti i contenuti testuali - sia delle didascalie sia quelli contenuti nelle immagini - analizzabili da software di linguistica dei corpora. Lo scopo del progetto è, da un lato, indagare come un luogo di dialogo digitale quale è Instagram possa essere un contenitore di usi linguistici innovativi, che si suppone non si trovino in tale quantità e varietà in altre piattaforme né in altre tipologie testuali (per esempio articoli di giornale o produzioni letterarie, ma neanche in produzioni orali) e, dall’altro, creare una metodologia di raccolta dati per costruire dataset relativi a casi di studio di linguaggio inclusivo che possa essere replicabile, anche per altre piattaforme e per altre lingue.
IncluInstIT: Un nuovo corpus per lo studio di linguaggio inclusivo su Instagram
Irene Caiazzo;Giovanna Maria Dimitri;Liana Tronci
2025-01-01
Abstract
Il contributo presenta una ricerca, tuttora in corso, di raccolta e analisi del corpus IncluInstIT, composto da forme di linguaggio inclusivo di genere presenti nella piattaforma social Instagram. Il corpus è stato elaborato attraverso metodologie semiautomatiche sia durante la fase di iniziale di raccolta dei post per la creazione del dataset, che nel successivo trattamento dei dati scaricati per selezionare i post pertinenti alla ricerca e rendere tutti i contenuti testuali - sia delle didascalie sia quelli contenuti nelle immagini - analizzabili da software di linguistica dei corpora. Lo scopo del progetto è, da un lato, indagare come un luogo di dialogo digitale quale è Instagram possa essere un contenitore di usi linguistici innovativi, che si suppone non si trovino in tale quantità e varietà in altre piattaforme né in altre tipologie testuali (per esempio articoli di giornale o produzioni letterarie, ma neanche in produzioni orali) e, dall’altro, creare una metodologia di raccolta dati per costruire dataset relativi a casi di studio di linguaggio inclusivo che possa essere replicabile, anche per altre piattaforme e per altre lingue.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.