Textanalysedaten am WZB  Textanalysedaten am WZB
Drucken
-A +A

Aufbereitet: 3,9 Millionen Parlamentsreden zur EU

Politik entsteht in und durch Text. Reden, Parteiprogramme, Gesetzestexte oder die öffentliche Berichterstattung verraten viel über die Positionen, Prioritäten und Strategien gesellschaftlicher Akteure. Moderne Verfahren der maschinellen Analyse großer Textmengen sind deshalb auch für die politischen Wissenschaften von Bedeutung. Auch das WZB entwickelt solche Methoden. Es stellt vor allem umfassende Dateninfrastrukturen bereit. Eine neue Datenquelle haben jetzt Christian Rauh, Pieter  De Wilde und Jan Schwalbach erschlossen: Sie erfassten über 3,9 Millionen Reden in nationalen Parlamenten zu Debatten über EU-Themen.

Ihr Datensatz umfasst neben Deutschland weitere sechs europäische Staaten und deckt jeweils mehr als 20 Jahre parlamentarischer Debatten ab. Die Redetexte sind mit relevanten Metadaten ergänzt, in maschinenlesbaren Formaten aufbereitet und stehen anderen Forschern frei zur Verfügung: www.bit.ly/ParlSpeech

Textanalysedaten werden am WZB auch im Manifestoprojekt bereitgestellt. Der Datensatz umfasst Wahlprogramme von Parteien aus über 40 Ländern in 34 Sprachen, von denen über 1900 jetzt auch computerlesbar sind. Das heisst: Die kodierten Parteiprogramme können automatisch ausgelesen werden, etwa um Algorithmen zu trainieren, die politische Texte dann automatisch in substantiell relevante Kategorien einordnen.