Wo lagen die Stärken, wo liegen die Schwächen unserer Vorhersage der Kommunalwahl in Nordrhein-Westfalen? In diesem Artikel beleuchten wir die Hintergründe.
In einem früheren Artikel haben wir unsere methodischen Änderung zur Kommunalwahl in Nordrhein-Westfalen dargestellt. Doch haben sich unsere Änderungen bewährt? Werden wir diese dauerhaft beibehalten oder wieder einstampfen? Nun, finden wir es heraus.
Eine Erklärung gleich zu Beginn, wir haben auf unsere streng methodische Auswertung verzichtet. Das Argument hinter dieser Entscheidung liegt in der Kombination aus Wahlrecht und Schätzmethode. Nochmals zur Erinnerung, unser Modell schätzt die Anzahl der Stimmen, die jeder Kandidat in ihrem Wahlbezirk erhält. Danach werden die errechneten Stimmen auf Partei-level summiert – die Parteien erhalten nun Sitzen, die in Kombination mit den Direktmandaten, zu einer repräsentativen Abbildung des Parteiergebnisse addiert („Listensitze“). Wenn wir jetzt die Anzahl der Sitze für jede Partei auswerten machen wir zweierlei: Wir werten die Qualität des Schätzers bei den Direktmandaten aus und gleichzeitig die danach addierten Listensitze, doch wir schätzen nur Ersteres. Für jedes falsche Ergebnis bestrafen wir unseren Algorithmus zweifach, der Fehler und der Folgefehler beim summieren. Dadurch machen wir das Ergebnis schlechter als es eigentlich ist.
Die Alternative ist eine Auswertung nur bei Direktmandaten. Das ist technisch fair, jedoch äußert un-intuitiv. Wer würde schließlich nur die Hälfte der Sitze nach korrekter Zuordnung auswerten und die andere Hälfte ignorieren?
Beide Optionen erscheinen uns nicht in unsere Arbeitsethik passend, weshalb wir uns gegen eine technische Auswertung entschieden haben.

Und wie steht es um unsere neu integrierten Vorhersagefaktoren? Gut und schlecht zugleich, aber doch immer eindeutig. Starke Vorhersagekraft haben die inhaltliche Ausrichtung der Bundespartei – manche Wähler entscheiden auf lokaler Ebene anhand der Inhalte auf nationaler Ebene. Dabei ist wichtig im Hinterkopf zu behalten, dass für eine Vielzahl an Listen keine inhaltliche Positionen gibt, da sie nur auf kommunaler Ebene existieren. Eine Liste, die nicht direkt bewertet wurde, geht mit einem Durchschnittswert ein, je nachdem in welchem Spektrum der Parteienlandschaft sie sich in etwa befindet. Selbstverständlich ist das eine grobe Vereinfachung, die weh tut. Die Ermangelung anderer Quellen und die unstemmbare Aufgabe jede Kommunalliste inhaltlich zu bewerten, lässt uns keine andere Wahl. Das es trotzdem zur Qualität der Vorhersage beiträgt ist daher keine Selbstverständlichkeit.
Große Hoffnungen hatten wir in Geodaten gesetzt. Leider sind die Resultate eher ernüchternd. Sowohl die Distanz eines Wahlbezirks zur Universität als auch zu einem Gefängnis scheinen keine große Rolle gespielt zu haben. Einzig die Entfernung zum Stadtzentrum kann durchaus für weitere Vorhersage in Betracht gezogen werden.
Die Geodaten haben es uns außerdem ermöglicht den Wahlbezirken zivilgesellschaftliche Proteste zuzuordnen. Besonders die Variable, wie oft bestimmte Protest-Events in den Medien besprochen wurde, hat einigen Schätzern geholfen. Wir interpretieren das so, dass diese Variable gesteigertes Politikinteresse aufgreift – zumindest abseits der Margen. Das motiviert uns auch in diese Richtung weiterzuarbeiten. Wir denken konkret darüber nach noch andere Eventarten, wie Streiks, aufzunehmen und uns noch genauer anzuschauen, wer diese organisiert und an wen sie gerichtet sind.