Corpora
Univers-ITA
Il progetto UniverS-Ita raccoglie 2137 testi (810.715 tokens) scritti da studenti universitari, provenienti da 45 atenei, a cui era stato chiesto di produrre un elaborato in italiano formale sulle proprie esperienze scolastiche durante il periodo di lockdown sanitario del 2020. Ogni testo del corpus è affiancato da un ricco corredo di metadati sociobiografici raccolti tramite un questionario di oltre 50 domande.
Univers-ITA-ProUniv
Il corpus UniverS-Ita-ProUniv è costituito soprattutto da tesi (nella versione non corretta dal relatore) e da relazioni universitarie (773 testi, per un totale di 6.267.765 tokens). Per questi testi, come indicato nel vademecum di consultazione, sono disponibili alcuni metadati come, ad esempio, la collocazione geografica dell'ateneo, l'area disciplinare del corso di laurea dello scrivente, il sesso e la regione di nascita dello scrivente, etc.).
Univers-ITA-ProGior
Il corpus UniverS-Ita-ProGior è costituito da testi tratti da giornali universitari (1.630 testi, per un totale di 1.692.846 tokens). Anche per questi testi, come indicato nel vademecum di consultazione, sono disponibili alcuni metadati come l'argomento del testo, l'anno di redazione, etc.).