Podcast Analyse Tool zur NLP Untersuchung von deutschsprachigen Corona Podcasts.
- Entwicklungsumgebung schaffen
- Datenerfassung
- automatisierter Download von MP3 und Transkript
- BUG : NDR nur 39 pdfs
- Datenaufbereitung
- Ordnung
- Unicode / ASCII Problem
- Annotation (?)
- Auswertung
- Wordcount per Person
- Sentimentanalyse
- TextBlob-de Standard
- eigenes Wörterbuch
- Wortartvergleich
- Visualisierung
Es wird Python >= 3.9 benötigt.
Mit pip install -r requirements.txt
werden die nötigen Module installiert.
Mit python dataTools.py
können bei bestehender Internetverbindung die Podcast-Transkripte von MDR und NDR heruntergeladen werden.