Hinweis zu Affiliate-Links: Alle Produkte werden von der Redaktion unabhängig ausgewählt. Im Falle eines Kaufs des Produkts nach Klick auf den Link erhalten wir ggf. eine Provision.

Ein Berliner Daten-Nerd will die Bundestagswahl vorhersagen

von Gründerszene
Marcus Groß will zeigen, was mit Big Data möglich ist: Für die Wahlen im Herbst hat er ein Modell entwickelt, das Prognosen für den Wahlausgang erlaubt.

Es ist keine leichte Zeit für Demoskopen. Regelmäßig lagen Umfrageinstitute mit ihren Aussagen über bevorstehende Wahlen zuletzt daneben. Krassestes Beispiel: der Erfolg von Donald Trump bei den US-Präsidentschaftswahlen, den kaum ein Experte vorhergesagt hatte. Auch Super-Nerd Nate Silver, der 2012 noch für jeden der 50 Bundesstaaten den richtigen Gewinner prognostiziert hatte, räumte Hillary Clinton kurz vor der Wahl noch eine 71-prozentige Chance ein, den Urnengang für sich zu entscheiden. Andere Prognosen waren vom Ergebnis noch weiter entfernt: Die New York Times sah Clintons Chancen bei 85 Prozent, die Huffington Post bei 98 Prozent.

Allerdings: Diese Werte sind Wahrscheinlichkeiten. Für viele Menschen ist das schwer nachzuvollziehen, aber 71 Prozent Wahrscheinlichkeit für einen Ausgang heißt eben auch: In gut einem von drei Fällen würde das andere Ergebnis eintreten. Nate Silver ist für uns Deutsche auch insofern ein Exot, als dass seine Disziplin – die Prognose des Wahlausgangs – hierzulande quasi nicht existiert. Mit Forsa, Allensbach und Co. gibt es zwar eine Reihe hochseriöser Umfrageinstitute, aber im Bezug auf bevorstehende Wahlen konzentrieren diese Demoskopen sich auf die sogenannte Sonntagsfrage: Welche Partei würden Sie wählen, wenn am nächsten Sonntag Bundestagswahl wäre? Damit lässt sich die aktuelle politische Stimmung gut wiedergeben, aber was den Ausgang einer Wahl, die erst in einigen Monaten stattfindet, angeht, sind die Umfragen wenig aussagekräftig. (Obwohl viele Medien es regelmäßig so darstellen, als ob das das so wäre.)

In die Marktlücke für politische Prognosen will Marcus Groß stoßen. Der junge Statistiker, der bei einer kleinen Berliner Agentur für Big-Data-Analyse angestellt ist, hat das nach eigener Aussage erste Modell für die deutschen Bundestagswahlen erstellt, in das aktuelle und historische Umfrage- sowie tatsächliche Wahlergebnisse einfließen und außerdem eine Gewichtung danach, wie akkurat die verschiedenen Institute bisher Wahlausgänge vorhergesagt haben und ob sie bestimmte Parteien immer wieder über- oder unterschätzen. „Wir gehen eine Stufe höher als die Umfrageinstitute, auf eine Meta-Ebene“, erklärt Groß im Gespräch mit Gründerszene. „Wir leiten neue Aussagen her, was die Institute bislang nicht können.“

Auf dem Blog seines Arbeitgebers INWT Statistics erläutert Groß detailliert sein Vorgehen und die Methodik dahinter. Und er gibt von jetzt an einmal pro Woche, immer montags, seine Prognosen ab. Die sind Stand heute durchaus überraschend: Die Union dürfte demnach überzeugende 35 Prozent einfahren, die SPD nach offensichtlich verpufftem Schulz-Effekt nur 28 Prozent. Die drittstärkste Partei wären die Grünen, die FDP würde es nur knapp in den Bundestag schaffen. Die AfD bekäme neun Prozent – wobei in diesem Fall die Datengrundlage am schwächsten sein dürfte, da das Modell vor allem auf Werten aus der Vergangenheit aufbaut und die AfD erst zum zweiten Mal an einer Bundestagswahl teilnimmt. 

Für eine rot-rot-grüne Mehrheit sieht das Modell eine Wahrscheinlichkeit von immerhin 32,5 Prozent, für Schwarz-Grün 28,5 Prozent. Angela Merkel hat unter diesen Voraussetzungen eine 66,9-prozentige Chance, Kanzlerin zu bleiben – und Martin Schulz, logisch, nur eine 33,1-prozentige Chance, das Kanzleramt zu erobern.

Groß hat sein Rechenmodell an vergangenen Wahlen getestet, das Ergebnis: Die Prognosen waren elf Prozent genauer als die letzten Vorhersagen der traditionellen Umfrageinstitute. Das wirft die Frage auf: Warum gibt es so etwas noch nicht? Groß‘ Erklärung, die vermutlich auch viele Digital-Denker teilen: „Die Deutschen sind nicht so Big-Data-affin.“ Data Science als Disziplin sei „bis vor ein paar Jahren an den Unis kaum präsent“ gewesen. Und: „Das ist kompliziert umzusetzen.“

Tatsächlich gibt es ein weiteres Projekt, das zumindest angekündigt hat, „mithilfe statistischer Modelle […] eine gewichtete Wahlprognose über Institute und weitere Faktoren hinweg“ zu entwickeln. Das vom Medieninnovationszentrum Babelsberg geförderte Team von Signal & Rauschen ist allerdings noch immer nicht gestartet. Unter den vorhandenen Angeboten kommt dem vielleicht die Meinungsforschungsagentur Pollytix am nächsten, die aus den Umfragen der vergangenen 20 Tage einen Trend errechnet.

Dass Groß ein tragfähiges, gutes Modell hinbekommen könnte, liegt nahe: Er hat Statistik in München und Berlin studiert, zu räumlichen Mess­fehler­modellen promoviert und ist bei INWT heute Experte für Bayesianische Statistik. Die Beschäftigung mit Wahlprognosen hat er nebenbei begonnen, als „Spaßprojekt“, wie er sagt. Sein Arbeitgeber profitiert natürlich trotzdem davon: Das ganze könnte richtig gute Werbung für INWT werden. Das Unternehmen mit elf Mitarbeitern ist eine Ausgründung der Freien Universität Berlin und hilft Kunden wie Zalando oder Otto beim Umgang mit und der Analyse von großen Datenmengen. 

Auf jeden Fall zeigt Groß mit dem Projekt, was mit Big Data möglich ist – egal, ob er mit seinen Prognosen am Ende sehr nah am Wahlergebnis liegen wird oder nicht. Eins ist jedenfalls schon klar: Im Anschluss will Marcus Groß zur Manöverkritik antreten. Und analysieren, wo das Modell gut war und wo es noch besser werden muss.

Gründerszene

Dieser Artikel erschien zuerst bei Gründerszene
Das Original lest ihr hier.

GQ Empfiehlt