Skip to content

Zadest/PodcastNLP

Repository files navigation

PodcastNLP

Podcast Analyse Tool zur NLP Untersuchung von deutschsprachigen Corona Podcasts.

TODOS

  • Entwicklungsumgebung schaffen
  • Datenerfassung
    • automatisierter Download von MP3 und Transkript
    • BUG : NDR nur 39 pdfs
  • Datenaufbereitung
    • Ordnung
    • Unicode / ASCII Problem
    • Annotation (?)
  • Auswertung
    • Wordcount per Person
    • Sentimentanalyse
      • TextBlob-de Standard
      • eigenes Wörterbuch
    • Wortartvergleich
  • Visualisierung

0 Setup

Es wird Python >= 3.9 benötigt. Mit pip install -r requirements.txt werden die nötigen Module installiert.

1. Datensammlung

Mit python dataTools.py können bei bestehender Internetverbindung die Podcast-Transkripte von MDR und NDR heruntergeladen werden.

2. Datenauswertung

3. Fazit

About

Corona Podcast Analyse Tool.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published