In diesem Beitrag möchten wir euch aufzeigen, welche Faktoren unser Modell inakkurat geschätzt hat und ob es dafür eine intuitive Erklärung gibt.
In der ersten Analyse zur Kommunalwahl in Bayern hatten wir bereits festgestellt, dass wir ca. 75% – 86% Prozent der Sitze richtig vorausgesagt haben, abhängig von der genauen Art und Weise der Beurteilung. Wir glauben, das ist ein guter Wert. Doch heißt das zur gleichen Zeit, dass 25-14% der Sitze falsch zugeordnet wurden.
Um herauszufinden, welche Faktoren in der Tendenz falsch eingeschätzt wurden, haben wir unseren Datensatz neu gemischt. Konkret bedeutet das, dass wir ein paar der Daten von 2020 in den Lerndatensatz aufgenommen haben und dafür einen Teil der 2014 Ergebnisse vorhersagen (nicht zum Lernen benutzen). Dadurch werden Faktoren, die in 2020 wichtig waren erkannt, denn der Algorithmus kann die einzelnen Faktoren besser auf 2020 zugeschnitten gewichten. Dadurch steigert sich natürlich die Vorhersagekraft enorm (ca. 95% richtig), was aber nicht überrascht und uns aber auch nicht mehr interessiert, als zu wissen, dass unsere statistische Methodik an und für sich nicht völlig verkehrt ist. Viel interessanter ist, dass sich einzelnen Inputs in ihrer Wichtigkeit verändern und dadurch die Vorhersage im Nachhinein besser machen. Wir können sagen, dass im Vergleich zu einer Vorhersage mit ca. 95% Richtigkeit ein Reihe von Faktoren unterschätzt und eine andere überschätzt wurde.
Manche Änderungen sind dabei intuitiv, andere lassen sich schwer erklären. In jedem Fall lohnt ein Blick auf die missschätzen Faktoren. Vorweg gilt es zu sagen, dass wir, wie immer wenn nicht explizit anders geschrieben, keine Kausalität implizieren.
Die „Unterschätzten“
1. SPD Stimmen der letzten Wahl. Gegeben, dass unser Modell die SPD in fast allen Städten und Gemeinden überschätzt hat (Ausnahme: Dachau), könnte dieser Faktoren überraschen. Doch tatsächlich ist die Erklärung vermutlich intuitiv. Wir vermuten, dass die Schätzer die negativen Abhängigkeiten von SPD Stimmen unterschätzt haben und somit in der Wichtigkeit ebenfalls unterschätzt.
2. Grüne Stimmen bei der letzten Wahl. Die Grünen wurden in unserer Vorhersage ziemlich systematisch unterschätzt. Dass das in der „korrigierten“ Fassung nicht auch eintritt, stellt die größere Wichtigkeit für diese Variable dar. Es absorbiert vermutlich einen große Anzahl an Effekte und wird dadurch wichtiger. Einen Effekt konnten wir im Nachhinein jedoch explizit benennen. Die Wichtigkeit des Themas „Klimawandel„, so wie von uns gemessen, wurde unterschätzt. Wir arbeiten daher an einer verbesserten Messung der Wichtigkeit von abstrakten Themen im öffentlichen Diskurs.
3. AfD Liste. Insgesamt waren unsere Schätzungen für die AfD einen Tendenz zu niedrig. Zumindest schließen wir das aus der Wichtigkeit der AfD Variablen. In etwas geringerem Maße wurde die Bedeutung der „Asylsuchenden“ überschätzt – die Variable, die den Großteil des geschätzten AfD Auftriebs in unserem Modell erklärt. Konkret könnte man daraus schlussfolgern, dass sich die AfD zunehmend von der eigentlichen Flüchtlingsbewegung abkoppelt und ein festes Milieu erreicht. Eine alternative Interpretation wäre, dass die Flüchtlingszahlen für die AfD nie wirklich relevant waren sondern vielmehr die Entstehung eine sozialen Milieus, dass durch die Flüchtlingskrise geformt wurde.
Die „Überschätzten“
1. 65+. Verglichen zu unserem historischen Datensatz hat sich die Gruppe der über 65-jährigen als weniger wichtig herausgestellt. Das heißt nicht, dass die CSU oder SPD, traditionell Parteien die bei älteren Wählern punkten, deswegen schlechter vorhergesagt wurden. Wenn auch eine mögliche Erklärung, so halte ich persönlich es für wahrscheinlicher, dass ein Teil des Effekts von einer anderen Variablen aufgenommen wurde.
2. FDP. Das eine Liste zur FDP gehört spielt eine geringere Rolle als angenommen. Im ersten Schritt bedeutet das lediglich, dass sich eine FDP Liste weniger von einer Lokalliste in der Wichtigkeit unterscheidet. Dabei ist nicht klar, ob der Effekt an und für sich positiv oder negativ ist, aber da wir die FDP in der Tendenz etwas unterschätzt haben liegt die Vermutung nahe, dass der Effekt negativ war.
Wenn ihr allerdings andere Interpretationen habt, lasst sie uns wissen. Denn wie ihr nicht nur zwischen den Zeilen lesen konntet, gibt es doch große Grauzonen.