Poisson-Verteilung für Fußballwetten: Tore statistisch vorhersagen

Eine Formel aus dem 19. Jahrhundert trifft auf modernen Fußball
Siméon Denis Poisson hat seine Verteilungsformel 1837 veröffentlicht — für juristische Fehlurteile, nicht für Fußballergebnisse. Dass sein Modell fast zwei Jahrhunderte später die Grundlage für Tor-Prognosen in der Bundesliga bildet, hätte ihn vermutlich irritiert. Wetter hingegen sollte es nicht überraschen: Tore in einem Fußballspiel sind seltene, unabhängige Ereignisse, und genau dafür ist die Poisson-Verteilung gemacht.
Die praktische Relevanz hat sich in den letzten Jahren durch akademische Validierung erhärtet. Penn und Donnelly von der University of Oxford und dem Imperial College modellierten die Ergebnisse der Euro 2020 mit einem doppelten Poisson-Ansatz und erreichten eine mittlere quadratische Abweichung (MSE) von 2,05 — signifikant besser als lineare Modelle mit MSE 2,21. Ihr Modell gewann den Prognose-Wettbewerb der Royal Statistical Society.
Für Wetter ist das die entscheidende Information: Ein mathematisches Modell, das auf einer Formel aus dem 19. Jahrhundert basiert, kann Fußballergebnisse mit messbarer Genauigkeit vorhersagen. Nicht perfekt, nicht immer, aber besser als die meisten Alternativen. Und das Beste daran: Man braucht weder Programmierkenntnisse noch teure Software, um es anzuwenden. Ein Taschenrechner und die Saisonstatistiken der Bundesliga genügen.
Poisson Schritt für Schritt: Lambda berechnen
Die Poisson-Verteilung braucht genau einen Parameter: Lambda (λ). Lambda ist der Erwartungswert — die durchschnittliche Anzahl der Tore, die ein Team in einem bestimmten Spiel erzielen dürfte. Die gesamte Prognose steht und fällt mit der Qualität dieser Schätzung.
Der einfachste Weg zu Lambda führt über die Saisonstatistik. Drei Werte werden benötigt: die durchschnittliche Offensivstärke des Heimteams, die durchschnittliche Defensivschwäche des Auswärtsteams und der Ligadurchschnitt. Die Formel ist nicht kompliziert, aber sie erfordert Sorgfalt.
Zunächst der Ligadurchschnitt: In der Bundesliga-Saison 2024/25 wurden im Schnitt rund 3,1 Tore pro Spiel erzielt, also etwa 1,65 Heimtore und 1,45 Auswärtstore. Diese Werte bilden die Basislinie.
Die Offensivstärke eines Teams berechnet sich als Verhältnis seiner Tore pro Spiel zum Ligadurchschnitt. Angenommen, Bayer Leverkusen erzielt zu Hause im Schnitt 2,3 Tore. Die Offensivstärke beträgt dann 2,3 / 1,65 = 1,39. Das Team ist offensiv 39 Prozent stärker als der Durchschnitt. Die Defensivschwäche des Gegners folgt dem gleichen Prinzip: Wenn der Gegner auswärts im Schnitt 1,8 Tore kassiert, ergibt sich 1,8 / 1,45 = 1,24.
Lambda für die Heimmannschaft ist dann: Offensivstärke × Defensivschwäche × Ligadurchschnitt Heim = 1,39 × 1,24 × 1,65 = 2,84. Das Heimteam wird also im Schnitt 2,84 Tore erzielen. Für das Auswärtsteam wird die Rechnung mit vertauschten Rollen wiederholt.
Sobald Lambda steht, liefert die Poisson-Formel die Wahrscheinlichkeit für jedes mögliche Torergebnis. Die Formel lautet: P(k) = (λ^k × e^(−λ)) / k!, wobei k die Anzahl der Tore ist. Für Lambda = 2,84 ergeben sich folgende Wahrscheinlichkeiten: 0 Tore = 5,8 %, 1 Tor = 16,5 %, 2 Tore = 23,5 %, 3 Tore = 22,2 %, 4 Tore = 15,8 %. Die höchste Einzelwahrscheinlichkeit liegt bei zwei Toren — was intuitiv passt, wenn der Erwartungswert bei 2,84 liegt.
Die Genauigkeit des Ansatzes wurde empirisch bestätigt. Eine Poisson-basierte Regression für die Premier League 2022/23 zeigte, dass die prognostizierte Torzahl in der überwiegenden Mehrheit der Spiele um maximal ein Tor vom tatsächlichen Ergebnis abwich. Größere Abweichungen traten fast ausschließlich in Überraschungsspielen auf — also dort, wo jedes Modell an seine Grenzen stößt.
Der wichtigste Fehler bei der Lambda-Berechnung: zu wenige Spiele als Basis. Fünf Spieltage reichen nicht für belastbare Durchschnitte. Ab dem zehnten Spieltag stabilisieren sich die Werte. Wer vorher modelliert, arbeitet mit Rauschen statt mit Signal. Außerdem lohnt es sich, die letzten sechs bis acht Spiele stärker zu gewichten als den Saisonstart, weil Kaderänderungen, Verletzungen und Formkurven die Leistung verschieben.
Ein zweiter Stolperstein betrifft die Heim-/Auswärtsdifferenzierung. Viele Einsteiger berechnen Lambda auf Basis der gesamten Saisonstatistik — also Heim- und Auswärtsspiele gemischt. Das verwischt den Heimvorteil, der in der Bundesliga zwar seit zwei Jahrzehnten schrumpft, aber weiterhin messbar existiert. Die sauberere Methode: Für Heimspiele nur die Heimstatistik verwenden, für Auswärtsspiele nur die Auswärtsstatistik. Erst dann bildet Lambda die tatsächliche Spielstärke am jeweiligen Austragungsort ab.
Vom Modell zur Wette: Wahrscheinlichkeitsmatrix erstellen
Sobald Lambda für beide Teams berechnet ist, lässt sich eine vollständige Ergebnismatrix aufbauen. Die Grundannahme der doppelten Poisson-Verteilung: Die Tore beider Mannschaften sind unabhängig voneinander verteilt. Das ist eine Vereinfachung — in der Realität beeinflusst ein frühes Tor das Spielverhalten — aber eine, die in der Aggregation erstaunlich gut funktioniert.
Die Matrix entsteht durch Multiplikation der Einzelwahrscheinlichkeiten. Wenn die Heimmannschaft mit Lambda 2,84 eine Wahrscheinlichkeit von 16,5 % für genau ein Tor hat und die Auswärtsmannschaft mit Lambda 1,10 eine Wahrscheinlichkeit von 36,7 % für genau ein Tor, dann beträgt die Wahrscheinlichkeit für das Ergebnis 1:1 exakt 16,5 % × 36,7 % = 6,1 %.
Dieses Prinzip wird für jede Kombination von 0 bis 5 Toren pro Team angewandt — insgesamt 36 Zellen. Die Summe aller Zellen ergibt nahezu 100 % (die restlichen Bruchteile entfallen auf höhere Ergebnisse, die praktisch vernachlässigbar sind).
Aus der Matrix lassen sich sämtliche gängigen Wettmärkte ableiten. Für den 1X2-Markt werden die Zellen addiert: Alle Ergebnisse, bei denen das Heimteam mehr Tore hat, ergeben die Heimsieg-Wahrscheinlichkeit. Die Diagonale (0:0, 1:1, 2:2 usw.) liefert die Unentschieden-Wahrscheinlichkeit. Für Over/Under 2.5 addiert man alle Zellen mit einer Torsumme von drei oder mehr (Over) beziehungsweise null bis zwei (Under). Beide Ergebnis-Wetten, die oft hohe Quoten bieten, lassen sich durch exakte Zellwerte beziffern.
Die eigentliche Wettentscheidung entsteht im Vergleich. Die Modell-Wahrscheinlichkeit für ein Unentschieden liegt bei 6,1 + 4,8 + 2,0 + 0,5 = 13,4 %. Der Buchmacher bietet eine Quote von 4,50 — das entspricht einer Implied Probability von 22,2 %. Hier liegt kein Value, denn der Markt hält das Unentschieden für wahrscheinlicher als das Modell. Andersherum: Wenn das Modell für Over 2.5 eine Wahrscheinlichkeit von 72 % ergibt und die Quote bei 1,65 liegt (Implied Probability 60,6 %), entsteht ein Edge von über 11 Prozentpunkten.
Die Matrix ist kein Endprodukt — sie ist ein Ausgangspunkt. Wer sie als einziges Entscheidungskriterium verwendet, ignoriert alles, was Poisson nicht erfasst: taktische Umstellungen, Sperren, Motivation, Wetter. Aber als quantitative Grundlage, die durch qualitative Analyse ergänzt wird, ist sie eines der besten verfügbaren Werkzeuge für systematische Wetter.
Stärken und Schwächen des Poisson-Modells
Die größte Stärke des Poisson-Modells ist seine Zugänglichkeit. Man braucht keine Machine-Learning-Pipeline, keinen API-Zugang und kein Statistik-Studium. Die Formel ist seit 1837 bekannt, die Daten sind frei verfügbar, und die Berechnung passt in eine Tabellenkalkulation. Penn und Donnelly brachten es auf den Punkt: Obwohl das Modell auf einfachen Prinzipien basiert, lieferte es Prognosen für die Euro 2020 mit einer beachtlichen Genauigkeit.
Die Schwächen sind ebenso klar. Erstens: Die Unabhängigkeitsannahme. Poisson unterstellt, dass Heim- und Auswärtstore unabhängig voneinander fallen. In der Realität verändern Tore das Spielverhalten — ein Rückstand führt zu offensiverem Spiel, eine Führung zu Absicherung. Zweitens: Poisson bildet keine Mannschaftsdynamik ab. Personalwechsel, Trainerwechsel oder eine Derbysituation fließen nicht in Lambda ein. Drittens: Extreme Ergebnisse — ein 0:6 etwa — sind in der Poisson-Verteilung extrem unwahrscheinlich, kommen in der Realität aber häufiger vor als das Modell suggeriert.
Trotzdem bleibt Poisson der beste Einstieg in die quantitative Wettanalyse. Nicht weil das Modell perfekt ist, sondern weil es Struktur erzwingt. Wer Lambda berechnet, denkt automatisch über Offensivstärke, Defensivschwäche und Ligakontexte nach — statt über Bauchgefühl und Wunschdenken. Das allein ist ein Fortschritt, der sich langfristig in besseren Entscheidungen niederschlägt.