La presente ricerca si propone di esplorare la capacità del Large Language Model GPT-4 di emulare lo stile di due riviste culturali italiane attive negli anni ’60, «Quaderni Piacentini» e «Quindici». Utilizzando un corpus derivato dai primi numeri delle riviste, trascritti attraverso OCR e poi accuratamente rivisti, il lavoro vuole valutare se GPT-4 sia in grado di eludere l’analisi stilometrica, scrivendo un testo che rispecchi la strategia editoriale di una determinata rivista. Dopo aver utilizzato GPT-4 per generare testi che riflettessero lo stile delle riviste grazie a specifici prompt, è stata condotta un’analisi stilometrica per confrontare i testi artificialmente generati con il corpus originale. I risultati evidenziano le sfide e le potenzialità di GPT-4 nella creazione di scritti con stili complessi. Il confronto con metodologie stilometriche tradizionali ha permesso di individuare i punti in cui le due riviste si distanziano e, di conseguenza, i nodi cruciali su cui il modello si concentra per la differenziazione stilistica e tematica. La ricerca intende aprire nuove prospettive sull’utilizzo della stilometria per l’analisi computazionale di testi relativi a specifici contesti culturali; se fino ad ora, infatti, la comunità scientifica si è concentrata sulla capacità degli LLM di riprodurre fedelmente stili di diversi autori o sull’indagine di piattaforme di scrittura, applicare queste metodologie all’ambito ristretto delle riviste consentirebbe più ampie considerazioni sulle strategie editoriali, sulle tendenze di lettura e sui processi di circolazione delle idee.

Analisi stilometrica applicata alle capacità emulative di GPT-4

Marco De Cristofaro;
2024-01-01

Abstract

La presente ricerca si propone di esplorare la capacità del Large Language Model GPT-4 di emulare lo stile di due riviste culturali italiane attive negli anni ’60, «Quaderni Piacentini» e «Quindici». Utilizzando un corpus derivato dai primi numeri delle riviste, trascritti attraverso OCR e poi accuratamente rivisti, il lavoro vuole valutare se GPT-4 sia in grado di eludere l’analisi stilometrica, scrivendo un testo che rispecchi la strategia editoriale di una determinata rivista. Dopo aver utilizzato GPT-4 per generare testi che riflettessero lo stile delle riviste grazie a specifici prompt, è stata condotta un’analisi stilometrica per confrontare i testi artificialmente generati con il corpus originale. I risultati evidenziano le sfide e le potenzialità di GPT-4 nella creazione di scritti con stili complessi. Il confronto con metodologie stilometriche tradizionali ha permesso di individuare i punti in cui le due riviste si distanziano e, di conseguenza, i nodi cruciali su cui il modello si concentra per la differenziazione stilistica e tematica. La ricerca intende aprire nuove prospettive sull’utilizzo della stilometria per l’analisi computazionale di testi relativi a specifici contesti culturali; se fino ad ora, infatti, la comunità scientifica si è concentrata sulla capacità degli LLM di riprodurre fedelmente stili di diversi autori o sull’indagine di piattaforme di scrittura, applicare queste metodologie all’ambito ristretto delle riviste consentirebbe più ampie considerazioni sulle strategie editoriali, sulle tendenze di lettura e sui processi di circolazione delle idee.
2024
978-88-942535-8-0
Stylometry
Authorship attribution
Large Language Models
GPT-4
File in questo prodotto:
File Dimensione Formato  
Analisi stilometrica applicata alle capacità emulative di GPT-4_AIUCD2024.pdf

accesso aperto

Tipologia: Versione Editoriale (PDF)
Licenza: Creative commons
Dimensione 1.23 MB
Formato Adobe PDF
1.23 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14091/13701
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
social impact