Wie viele Tore fallen in einem Bundesligaspiel?


Wie viele Tore fallen eigentlich durchschnittlich in einem Bundesligaspiel? Sind früher wirklich mehr Tore gefallen als heute? Wie groß ist die Wahrscheinlichkeit, dass fünf Tore in einem Spiel fallen? Und welches ist das häufigste Endergebnis? Die kurze Antwort ist: 2,86 Tore, ja, 8,8%, 1:1. Die etwas längere Antwort bietet Rasen1mal1 in diesem Beitrag.

Tore pro Spiel

Tore pro Spiel seit 1963

Die obige Grafik zeigt die Anzahl der pro Spiel gefallenen Tore gemittelt über 36 Spiele (oder 4 Spieltage) von 1963 bis heute. Wie man sieht sind in den ersten Bundesligasaisons etwas mehr Tore gefallen als heute. Ab etwa 1988 hat sich der Wert stabilisiert. Die verbleibenden Schwankungen sind im Rahmen der zu erwartenden statistischen Fluktuationen. Genauer sind seit 1988 2,86 Tore pro Spiel gefallen mit einer Standardabweichung von \(\sigma=1,71\) Toren. Nach dem zentralen Grenzwertsatz sollte der Mittelwert über 36 Spiele gut durch eine Normalverteilung mit Standardabweichung von \(1,71/\sqrt{36}\) genähert werden können. In der oberen Grafik befindet sich die rote Linie auf Höhe des Wertes von 2,86 Toren pro Spiel. In grün ist der Bereich von plus/minus zwei Standardabweichungen gekennzeichnet. Etwa 95% der Mittelwerte sollten innerhalb dieses Bereiches liegen, wenn man von konstanten 2,86 Toren pro Spiel ausgeht. Wie man sieht ist dies ab etwa 1988 gut erfüllt. Die Abweichungen in den 70er Jahren können dagegen nicht mit bloßen statistischen Schwankungen erklärt werden. Es sind also früher tatsächlich mehr Tore gefallen als heutzutage. Seit etwa 1988 kann der Wert von 2,86 Toren pro Spiel dagegen als konstant angenommen werden. Für die folgende Analyse wurden daher nur die Bundesligapartien seit 1988 verwendet.

Wahrscheinlichkeitsverteilung für die Anzahl der Tore pro Spiel

Wir haben gesehen, dass in einer Bundesligapartie im Durchschnitt 2,86 Tore pro Spiel fallen. Aber wie groß ist die Wahrscheinlichkeit, dass beispielsweise fünf Tore fallen? Um dies herauszufinden, müssen wir die ganze Wahrscheinlichkeitsverteilung und nicht nur den Mittelwert kennen. Eine übliche Annahme ist, dass die Anzahl der Tore pro Spiel durch eine Poisson-Verteilung genähert werden kann. Diese ist durch
\[p(k;\lambda) = \frac{\lambda^{k}}{k!}e^{-\lambda}\]
gegeben. Hier ist \(k\) die Anzahl der Tore pro Spiel und \(\lambda=2,86\) der Mittelwert der Verteilung. Für die Gültigkeit der Poisson-Verteilung wird angenommen, dass es zu jedem Zeitpunkt gleich wahrscheinlich ist, dass ein Tor fällt und insbesondere, dass die Tore unabhängig voneinander fallen. Es ist klar, dass dies nur näherungsweise richtig sein kann. Trotzdem ist es instruktiv die empirische Verteilung der Tore pro Spiel mit der Poisson-Verteilung zu vergleichen:

Tore pro Spiel Histogramm

Die obige Grafik zeigt die empirische Verteilung (graue Balken) der Tore pro Spiel in der Bundesliga seit 1988. Die blauen Balken zeigen die relativen Häufigkeiten, welche bei einer Poisson-Verteilung mit Mittelwert 2,86 zu erwarten wären. Wie man sieht ist die Poisson-Verteilung schon gar keine schlechte Näherung. Klar ist aber auch, dass es systematische Abweichungen gibt. Beispielsweise ist es bekannt, dass in der 2. Halbzeit mehr Tore fallen als in der ersten, was der Annahme einer zeitlich konstanten Wahrscheinlichkeit für ein Tor widerspricht. Genauer sind seit 1988 43% der Tore in der ersten Spielhälfte gefallen und 57% in der zweiten. Bei einer Menge von 8032 Spielen seit 1988 entspricht dies einem 14\(\sigma\) Effekt unter der Annahme, dass in der ersten und zweiten Hälfte gleich viele Tore fallen. Daher muss diese Annahme verworfen werden. Offensichtlich ist die Anzahl der Tore pro Spiel gleich der Summe aus den Toren aus der ersten und der zweiten Hälfte. Könnte es sein, dass die Anzahl der Tore in der ersten und der zweiten Hälfte jeweils poissonverteilt mit verschiedenen Mittelwerten sind? Die Summe zweier poissonverteilten Zufallsvariablen wäre dann wieder poissonverteilt mit \(\lambda\) gleich der Summe der jeweiligen Mittelwerte. Aber auch dies ist nicht der Fall. Um dies zu verdeutlichen schauen wir uns an wie groß die Warhscheinlichkeit ist, dass in der zweiten Halbzeit ein Tor fällt in Abhängigkeit vom Halbzeitstand. Genauer haben wir untersucht mit welcher Wahrscheinlichkeit ein Halbzeitstand von 0:0 auch in einem 0:0 nach der gesamten Spielzeit endet, und mit welcher Wahrscheinlichkeit es bei einem Halbzeitzustand von 1:0 bei diesem Ergebnis geblieben ist. Bei der für die Poisson-Verteilung wichtigen Annahme, dass Tore unabhängig von einander fallen, sollten die Wahrscheinlichkeiten übereinstimmen. Tatsächlich ist die empirische Wahrscheinlichkeit, dass ein 0:0 Halbzeitstand auch zu einem 0:0 Endstand führt, 25%, während die empirische Wahrscheinlichkeit, dass es bei einem 1:0 Halbzeitstand bei diesem Ergebnissen bleibt, lediglich 17% beträgt. Das heißt, Tore fallen nicht unabhängig voneinander. Hierfür gibt es eine intuitive Erklärung. Bei einem Spielstand von 1:0 wird die zurückliegende Mannschaft das Risiko erhöhen, um eventuell den Ausgleich zu erzielen und die Niederlage zu verhindern. Dadurch steigt die Wahrscheinlichkeit, dass sowohl die hinten liegende als auch die führende Mannschaft ein Tor erzielt. Bei einem Stand von 0:0 hingegen sind beide Teams mehr auf Sicherheit bedacht, um keine Niederlage zu riskieren. Dieser Effekt überträgt sich auch auf höhere Spielstände und lässt sich schön an den Abweichungen der empirischen Verteilung von der Poisson-Verteilung sehen. Bei einer ungeraden Anzahl von Toren liegt zwangsläufig eine der beiden Mannschaften hinten und wird das Risiko erhöhen. Bei einer geraden Anzahl von Toren besteht dagegen die Möglichkeit eines ausgeglichenen Spielstandes. Wir beobachten daher, dass Ergebnisse mit einer geraden Anzahl von Toren wahrscheinlicher bzw. Ergebnisse mit einer ungeraden Anzahl von Toren unwahrscheinlicher sind als von der Poisson-Verteilung, welche von unabhängigen Ereignissen ausgeht, vorausgesagt werden. So liegt die empirische Wahrscheinlichkeit für null Tore über der Poisson-Verteilung, die empirische Wahrscheinlichkeit für ein Tor unter der Poisson-Verteilung und die empirische Wahrscheinlichkeit für zwei Tore wieder über der Poisson-Verteilung usw. Es ist auch sinnvoll anzunehmen, dass dieser Effekt schwächer bei einer hohen Anzahl von Toren ist. Beispielsweise kann der Spielstand für fünf Tore 5:0 oder 3:2 sein. Bei einem 5:0 hat die unterlegene Mannschaft kaum eine Aussicht mehr die Partie zu drehen und daher kein Grund das Risiko zu erhöhen. Bei einem Spielstand von 3:2 dagegen könnte sich die Erhöhung des Risikos auszahlen. Die Wahrscheinlichkeit eines Endstandes mit gerader Anzahl von Toren ist also gegenüber der Wahrscheinlichkeit eines Endstandes mit ungerader Anzahl von Toren leicht erhöht, und dieser gerade/ungerade-Effekt nimmt für Spielstände mit einer höheren Anzahl von Toren ab. Wir können die Poisson-Verteilung verallgemeinern und einen weiteren Parameter \(\rho\) einführen, welcher den besagten Effekt berücksichtigt. Eine einfache Variante ist durch folgende Verteilung gegeben:

\[p(k;\lambda,\rho) = \frac{e^{-\lambda}}{1+\frac{\rho}{\lambda}(e^{-\lambda}-e^{-2\lambda})}\frac{\lambda^{k}}{k!}\left(1+\frac{\rho}{k+1}(-1)^{k}\right).\]

Die optimalen Parameterwerte sind \(\lambda=2,90\) und \(\rho=0,256\) (\(\lambda\) entspricht bei dieser Verteilung nicht mehr dem Mittelwert). Die entsprechenden Wahrscheinlichkeiten sind in der obigen Grafik durch die roten Balken dargestellt und stimmen gut mit den empirischen Werten überein. Im Rahmen der vorhergehenden intuitiven Argumentation kann \(\rho\) als ein Maß für die Bereitschaft der Mannschaften, das Risiko bei einer drohenden Niederlage zu erhöhen, angesehen werden. Je größer \(\rho\), desto größer die Risikobereitschaft.

Empirische Wahrscheinlichkeiten für Spielergebnisse

Wir wissen nun also wie viele Tore mit welcher Wahrscheinlichkeit in einem Bundesligaspiel fallen. Aber mit welcher Häufigkeit treten die einzelnen Ergebnisse auf? Die untere Grafik zeigt eine Heatmap für die empirischen Häufigkeiten der Ergebnisse.

Ergebnisse Heatmap

Je intensiver die Farbe eines dem Ergebnis entsprechenden Feldes, desto häufiger ist es seit 1988 aufgetreten. Das häufigste Ergebnis war ein 1:1 Unentschieden mit einer Häufigkeit von 12,3%. Danach folgen 1:0 und 2:1 Heimsiege mit einer Häufigkeit von 8,4% und 8,3%. Anhand der Grafik ist auch erkennbar, dass der Heimvorteil Realität ist. Die Heimmannschaften siegen im Mittel häufiger als die Auswärtsmannschaften.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *