Questo repository contiene i materiali didattici relativi al modulo "Esercitazioni di Sentiment Analysis" organizzato nell'ambito della Laurea Magistrale in Comunicazione per l'impresa, i media e le organizzazioni complesse (CIMO) presso l'Università Cattolica del Sacro Cuore di Milano. Le esercitazioni sono pensate per un pubblico senza competenze pregresse nel campo del Trattamento Automatico del Linguaggio né conoscenze di programmazione.
Lezioni teoriche
- Introduzione al Trattamento Automatico del Linguaggio
- Introduzione alla Sentiment Analysis
Esercitazioni pratiche
- Come creare nuovi set di dati per la Sentiment Analysis. Esercitazione usando 2 metodi: a) script in Python per lo scraping di Twitter b) estensione per browser WebScraper
- Sentiment Analysis basata sul lessico. Esercitazione con script in Python.
- Sentiment Analysis con sistemi supervisionati. Esercitazione con demo online.
- Panoramica di progetti di Sentiment Analysis
- Approfondimento sulla valutazione
- Lessico del progetto OpeNER:https://github.com/opener-project/VU-sentiment-lexicon/tree/master/VUSentimentLexicon/IT-lexicon
- Sentix: http://valeriobasile.github.io/twita/sentix.gz
- Morphologically-inflected Affective Lexicon (MAL): https://github.com/valeriobasile/sentixR/blob/master/sentix/inst/extdata/MAL.tsv
- Distributional Polarity Lexicon: http://sag.art.uniroma2.it/demo-software/distributional-polarity-lexicon/
- SenticNet: https://sentic.net/
- NRC-Emotion-Lexicon: https://saifmohammad.com/WebPages/NRC-Emotion-Lexicon.htm
- NRC-VAD-Lexicon: https://saifmohammad.com/WebPages/nrc-vad.html
- Italian EMotive lexicon (ItEM): https://github.com/Unipisa/ItEM
- DepecheMood v2.0: https://github.com/marcoguerini/DepecheMood/releases/tag/v2.0
- Sentipolc 2016: http://www.di.unito.it/~tutreeb/sentipolc-evalita16/data.html
- ABSITA 2018, Aspect-based Sentiment Analysis: http://sag.art.uniroma2.it/absita/data/
- Smartphone reviews annotated for the task of aspect-based Sentiment Analysis: https://github.com/nicolaCirillo/italian-sentiment-analysis
- HaSpeeDe 2018, Hate Speech Detection: http://www.di.unito.it/~tutreeb/haspeede-evalita18/data.html
- Italian Twitter Corpus of Hate Speech: https://github.com/msang/hate-speech-corpus
- Happy Parents: https://github.com/mirkolai/Happy-Parents
- WhatsApp Dataset for Cyberbullying Detection: https://github.com/dhfbk/WhatsApp-Dataset
- Irony and Tweets: https://github.com/IronyAndTweets/French-Italian-and-English-Corpora
- IronITA 2018, Irony Detection in Italian Tweets: http://www.di.unito.it/~tutreeb/ironita-evalita18/data.html
- Trip-MAML, Italian and Spanish annotated reviews: http://sentiwordnet.isti.cnr.it/trip-maml/tripmaml_ites.zip
- SentiML, http://corpus.leeds.ac.uk/marilena/SentiML/
- MultiEmotions-It, https://github.com/RacheleSprugnoli/Esercitazioni_SA/tree/master/dataset
- AriEmozione 1.0, https://zenodo.org/record/4022318#.YD9oNFVKiUk
- EMit (Emotions in Italian) at EVALITA 2023, http://www.di.unito.it/~tutreeb/emit23/data.html
- FEEL-IT: https://github.com/MilaNLProc/feel-it
- XLM-EMO: Multilingual Emotion Prediction in Social Media Text, https://github.com/MilaNLProc/xlm-emo