In diesem Artikel wird erklärt, welche Auswirkungen das Wahlsystem auf die Methodik hat. Weitergehend werden grundlegende Kategorien der statistischen Regression erklärt.
Kenner der verschiedenen Wahlsysteme in Deutschland wissen, dass es, vereinfacht gesprochen, zwei grundsätzliche Arten des Wählens gibt – Verhältnis- und Mehrheitswahlrecht. Bei der Mehrheitswahl gewinnt das Mandat derjenige, der im Wahlkreis die absolut meisten Stimmen erzielen konnte. Prominente Beispiele sind Senats- und Repräsentantenwahlen in den USA sowie die Abgeordnetenwahl in Großbritannien. Bei der Verhältniswahl wird eine Partei/Liste gewählt und dieser proportional zum Wahlergebnis eine Anzahl an Sitzen zugeteilt. Die Partei/Liste legt im Vorhinein die KandidatInnen und deren Listenplätze fest. Die Nationalräte in der Schweiz und Österreich sind prominente Beispiele.
Hier muss ich jetzt einen harten Strich setzen, denn als Nächstes möchte ich kurz auf zwei unterschiedliche statistische Methoden eingehen und danach Wahlrecht und Methodik zusammenführen. Statistische Vorhersagen lassen sich im Groben zu drei Kategorien zusammenfassen – Regression, Klassifikation und Segmentierung.
Segmentierung wird eingesetzt um ein Objekt einer Gruppe zuzuordnen. Beispielsweise möchten wir alle Instrumente eines Orchesters ihrer Familie zuordnen. Anhand von Merkmalen wie Material, Aussehen und Spielweise können wir feststellen, ob ein Instrument zum Blech, Holz oder den Streichern gehört. Segmentierung spielt bei unseren Vorhersagen selbst keine Rolle.
In der Klassifizierung wird ermittelt, ob Ereignis A oder B eintritt und mit welcher Wahrscheinlichkeit. Es kann entweder A oder B eintreten, jedoch nicht beide gleichzeitig. Man könnte anhand von Größe, Fell und Nasenlänge eine Wahrscheinlichkeit errechnen mit der Hund Hasso eine französische Bulldogge ist. Entscheidend ist hierbei, dass sich die Frage mit Ja oder Nein beantworten lässt.
Letztlich, die Regression, bei der es darum geht, einen genau Wert zu ermitteln. Zum Beispiel könnte man den Preis einer Wohnung mittels Quadratmeter, Baujahr, Ausstattung und Distanz zum Stadtzentrum etc. vorhersagen.

Wie hängt das zusammen ?
Wenn wir jetzt über das Problem der Wahlvorhersage nachdenken, kommt uns intuitiv die Regression als statistisches Mittel in den Sinn, da es um die Vorhersage einer Stimmanzahl X geht. Bei Verhältniswahlen werden die Stimmen für Parteien geschätzt und danach relativ die Anzahl der Sitze errechnet. Da sich eine Ja/Nein-Frage bezüglich der Wahl zwischen mehreren Parteien nicht intuitiv erschließt, ist Klassifizierung keine Alternative.
Bei Mehrheitswahlen sieht das auf den ersten Blick ähnlich aus, da auch dort Stimmen für Kandierende abgegeben werden. Aber man kann die gleiche Problemstellung auch mit Klassifizierung beantworten, indem man fragt ob eine Kandidatin gewählt wurde oder nicht. Wie bereits oben beschrieben, gibt uns die Klassifizierung auch Wahrscheinlichkeiten, was ein enormer Vorteil ist, denn so können Unsicherheiten in der Vorhersage besser abgebildet werden. Denn bei allem gilt: unsere Vorhersage bildet unserer Meinung nach das wahrscheinlichste Einzelergebnis, informiert aber nicht darüber, wie wahrscheinlich andere potenzielle Ergebnisse sind. Wenn wir einem Kandidaten 3300 Stimmen bescheinigen, ist das unser bester Versuch einer Schätzung auf der Basis unserer Daten. Das heißt jedoch nicht, dass nicht auch 3200 Stimmen eintreten können sondern lediglich, dass die Wahrscheinlichkeit dafür geringer ist. Wie genau und ob sich daraus eine andere Sitzverteilung ergäbe, wird aber aus einer einfachen Regression nicht ersichtlich. Wenn wir allerdings eine Gewinnchance von 65 % errechnen wird schnell sichtbar, dass eine relative große Unsicherheit vorliegt.
Um es kurz zu fassen, eine Verhältniswahl lässt uns keine andere Möglichkeit als zu einer Regression zu greifen, während eine Mehrheitswahl beide Optionen zulässt. Da Klassifikation die real existierenden Unsicherheiten besser ausdrückt, werden wir sie allerdings vorziehen.
