Dieser Artikel dreht sich um die Relevanz von Unsicherheiten bei Vorhersagen und wie wir das angehen.
Unsicherheit
In der Welt um uns gibt es Risiken und Unsicherheiten. Wir kennen diese nur zugut aus unserem Alltag – sie sind unsere ständigen Begleiter. Es gibt jedoch einen Unterschied zwischen Risiko und Unsicherheit. Es ist ein Unterschied zwischen subjektiver Bewertung und objektiver Wahrscheinlichkeit. Ein Beispiel: Ihr schaut morgens aus dem Fenster und es ist bewölkt aber regnet nicht. Glücklicherweise habt ihr euer Smartphone zur Hand, welches sagt, dass es regnen soll. Die Regenwahrscheinlichkeit liegt bei 85 %. Da ihr, wie die meisten Menschen, risikoavers (d.h. risikoscheu) seid, packt ihr einen Regenschirm ein. Euer Nachbar hingegen lässt seinen zu Hause. Schließlich betrage die Regenwahrscheinlichkeit nur 85 %. Offensichtlich habt ihr und der Nachbar die gleiche Vorhersage unterschiedlich bewertet. Die persönliche Einschätzung bezüglich der Vorhersage nass zu werden ist unterschiedlich. Bei Risiko geht es immer auch um subjektive Bewertung, sozusagen die subjektive Bewertung eines Schadens in einem Szenario. In unserem Beispiel ist es das Risiko nass zu werden. Ihr seht dieses Risiko als größer an, als euer Nachbar. Daher packt ihr einen Regenschirm ein, euer Nachbar nicht.

Nun wissen wir aber auch alle, dass die Wettervorhersage entweder richtig oder falsch sein kann. Das betrifft die Art von Unsicherheit, die für uns hier relevant ist – die Unsicherheit, die den Wahrheitsgehalt einer Vorhersage betrifft. Da wir hier beim Wahlorakel versuchen Vorhersagen über Vorkommnisse zu treffen, die noch nicht stattgefunden haben, können zwei Fälle eintreten. Entweder unsere Vorhersage ist richtig oder eben nicht. Im Bereich der statistischen Methoden gibt es verschiedene Möglichkeiten mit dieser Unsicherheit umzugehen. Wir können im Voraus versuchen ein gutes Maß der für die Unsicherheit unserer Vorhersage zu treffen. So ähnlich wie der Wetterdienst, der die Regenwahrscheinlichkeit angibt. Im Nachhinein können wir natürlich auch unser Ergebnis mit der Realität vergleichen. Im Wetterbeispiel passiert das genau dann, wenn wir zum angesagten Zeitpunkt nach Draußen schauen und beobachten ob es regnet oder nicht.
Im Falle der Wettervorhersage kann die Unsicherheit aus zwei verschiedenen Quellen stammen. Zum einen reden wir über die Zukunft. Es kann immer zu unvorhersehbaren Vorkommnissen kommen, die das Wetter beeinflussen und so die Vorhersage falsch machen (man denke an einen Vulkanausbruch, der plötzlich ein vulkanisches Gewitter erzeugen kann o.ä.). Zum anderen können die Daten, die als Grundlage für die Vorhersage genutzt wurden unvollständig oder schlecht sein. Auch dann wäre die Vorhersage unglaubwürdig.
Prinzipiell haben auch wir diese beiden Probleme. Es kann sein, dass vor der Wahl etwas passiert, mit dem wir nicht gerechnet hatten, was aber das Wahlergebnis beeinflusst – z.B. eine massive Ausbreitung des COVID-19 in nur einer Stadt, die die Wahlbeteiligung einer bestimmten Gruppe von Wählern unverhältnismäßig stark senken könnte. Zum anderen kann es sein, dass unsere Daten unvollständig oder schlecht sind. Dieses Problem versuchen wir zu umgehen, indem wir nur Daten von zuverlässigen Quellen benutzen (statistische Landesämter, Statistisches Bundesamt, etc.). Das andere Problem können wir nur bedingt beheben, indem wir uns Gedanken darüber machen welche Faktoren eine Wahl beeinflussen und unsere Vorhersagen nicht zu früh treffen. Generell gilt, je kürzer eine Vorhersage in der Zukunft liegt, desto mehr kann man über deren Unsicherheit aussagen.
Allerdings kommt noch eine weitere Dimension ins Spiel und hier hinkt der Vergleich mit dem Wetter etwas. Denn datenbasierte Erkenntnisse in Sozialwissenschaften sind etwas komplizierter als in den Naturwissenschaften. Wir haben keine Naturgesetze als Grundlage, nach denen sich unsere Beobachtungsgegenstände verhalten. In der Physik gilt z.B. die Gravitationskonstante, sie ist ein Naturgesetz und alle Dinge müssen sich nach ihr verhalten. Eine solche „Gesetzesgrundlage“ existiert in den Sozialwissenschaften nicht. So kann es vorkommen, dass viele Experten einer Meinung sind, und doch alle falsch liegen. (Als Beispiel sei hier die Phillipskurve genannt, ein Zusammenhang zwischen Arbeitslosigkeit und Inflation, den man lange Zeit für richtig hielt, der aber falsch war: https://de.wikipedia.org/wiki/Phillips-Kurve).
Nun stellt sich die Frage wie wir mit der Unsicherheit umgehen, und wie Sie als Leser mit unserer Vorhersage umgehen sollten. Den Fehler unserer Schätzung versuchen wir bestmöglich zu messen. Daher geben wir ein Konfidenzintervall an, indem wir den Standardfehler unserer Schätzung auf unsere Ergebnisse aufrechnen. Der Standardfehler liefert eine Aussage über die Güte des geschätzten Parameters. Je kleiner der Fehler desto besser erklärt unser Schätzer die Varianz unserer Daten (und wenn unsere Daten repräsentativ und gut erhoben sind, lassen sich Schlüsse auf die wirkliche Welt ziehen). Dieses Konfidenzintervall sieht man in unseren (Tacho-) Grafiken als transparenten Farbbereich, der um unsere konkrete Schätzung herumliegt. Der kräftige farbige Tacho-Balken gibt die Anzahl der Sitze an, die wir für diese Wahl schätzen. Der schwarze Strich ist das letzte Wahlergebnis. Sollte der kräftige Balken fehlen, heißt das, dass die Partei (oder Liste) keine Sitze erhält. Wenn die tatsächliche Anzahl der Sitze einer Partei innerhalb dieses transparenten Farbbereichs liegt, wären wir sehr zufrieden mit unserer Schätzung. Dann wäre unsere Vorhersage ziemlich genau.
Grundsätzlich könnte es aber auch sein, dass der Zusammenhang, den wir zwischen Wahlergebnissen und den Einflussfaktoren unseres Modells annehmen falsch ist. Wir glauben das zwar nicht und bisherige Ergebnisse zeigen zumindest, dass wir auf dem richtigen Weg sind. Dennoch sollte im Hinterkopf bleiben, dass empirische Vorhersagen im sozialwissenschaftlichen Kontext immer mit Vorsicht behandelt werden sollten. Wir werden auf jeden Fall jede Wahl, die wir vorhersagen dafür nutzen, um unser Model zu verbessern und die Unsicherheit zu verringern. Schließlich lässt sich im Nachhinein immer besser beurteilen ob sich der Regenschirm gelohnt hat oder nicht.