Bundesliga Data Shootout: Machine-Learning-Wettbewerb zu Fußball-Daten

Collage: DFL/Getty Images/Oliver Hardt/ Webstrategy GmbH

17.05.2023 – In der Bundesliga und 2. Bundesliga findet die Erfassung von Spiel-Ereignisdaten bisher größtenteils manuell statt. An diesem zeitintensiven Prozess sind mehrere Personen mit verschiedenen Arbeitsschritten beteiligt. Im Rahmen eines Kaggle-Wettbewerbs mit dem Titel Bundesliga Data Shootout haben nun mehr als 500 teilnehmende Teams ihre Ideen eingereicht, wie Künstliche Intelligenz (KI) künftig zuverlässig Spielereignisse erkennen könnte. Kaggle ist eine Online-Plattform Fokus auf die Bereiche Datenanalyse und Machine Learning. Initiatoren des Bundesliga Data Shootouts waren die DFL und ihre auf Spieldaten spezialisierte Tochterfirma Sportec Solutions AG (STS).

„Die umfangreichen Daten, die wir bei allen Spielen der Bundesliga und 2. Bundesliga erheben und mit Unterstützung unseres Technologiepartners Amazon Web Services in Echtzeit ausspielen, eröffnen viele Anwendungsmöglichkeiten für die Clubs und unsere Medienpartner“, erläutert Dr. Hendrik Weber, Direktor Sport-Technologie und Innovation der DFL. „Sie liefern im sportlich-taktischen Bereich wertvolle Erkenntnisse für Spielauswertung, Training und individuelle Spielerförderung. Die Daten bilden aber auch die Basis für viele Aktivitäten und Geschäftsfelder der DFL. Daher beschäftigen wir uns damit, wie der aktuell überwiegend manuelle Prozess der Ereignisdaten-Gewinnung zumindest in Teilen automatisiert und vielleicht auch skalierbar werden kann. Das würde nicht nur für unsere eigenen Wettbewerbe Synergien ermöglichen, sondern könnte auch eine Anwendung für andere Ligen und Wettbewerbe ermöglichen.“

Zwar können die Positionsdaten aller Spieler und des Balls bereits stark automatisiert erhoben werden, dies gelte aber nicht für die Ereignisdaten, schildert Mirko Janetzke, Senior Vice President Germany bei STS, die konkrete Aufgabenstellung des Wettbewerbs: „In Form einer Kaggle-Competition haben wir selbstlernende Softwaremodelle gesucht, die in ausgewählten Videoaufzeichnungen von Bundesligaspielen drei Arten von Spielereignissen zuverlässig identifizieren und zeitlich einordnen können: Einwürfe, Zuspiele und Zweikämpfe.“

Sieger des Bundesliga Data Shootouts war ein Dreier-Team aus Dr. Philipp Singer, Pascal Pfeiffer und Yauhen Babakhin, die bereits zuvor an entsprechenden Wettbewerben teilgenommen und mit ihren Entwicklungen Top-Plätze im internationalen Kaggle-Ranking erobert hatten. „Wir sind alle drei Fußballfans. Allein schon deshalb hat uns diese Competition direkt angesprochen“, sagt Pfeiffer über die Motivation des Gewinner-Teams. „Außerdem sind wir große Fans von Aufgabenstellungen aus dem Bereich der Computervision, wo es also um maschinelles Sehen geht. In diesem Fall war durch die sekundengenaue Zuordnung der entdeckten Ereignisse zur vorangeschrittenen Spielzeit eine zusätzliche Komplexität in der Aufgabenstellung angelegt, die uns gereizt hat. Wir haben hier Möglichkeiten gesehen, unser Können unter Beweis zu stellen und weiterzuentwickeln.“

Babakhin, Pfeiffer und Singer sind auch beruflich auf dem Feld der KI tätig. Eines ihrer Grundprinzipien ist es, das Rad nicht neu zu erfinden, wenn es nicht nötig ist, und auf alles zu verzichten, was die Durchführung der Aufgabe verkomplizieren könnte. „Wir fangen immer sehr einfach an,“ sagt Pfeiffer. „Wir achten darauf, für generalisierbare Modelle zu sorgen und uns nicht in Details zu verrennen. Als Befürworter schlanker End-to-End-Lösungen haben wir in diesem Fall nur das ursprüngliche Videobild ohne jegliche menschliche Veränderung als Input genutzt, um zu den gewünschten Erkenntnissen zu gelangen.“ Die Verwendung von Graustufenbildern anstatt Farbbildern reduzierte die Datenmenge deutlich und beschleunigte die Verarbeitung.

„Die Qualität der über 500 Bewerbungen war insgesamt außerordentlich gut,“ meint Weber. „Die siegreiche Lösung war, gemessen an den Beurteilungskriterien, das genaueste Modell. Wir waren beeindruckt von dem schlanken Konzept und der Treffgenauigkeit der Ergebnisse.” Janetzke ergänzt: „Diese Lösung war nicht annähernd so komplex, wie wir es erwartet hatten. Das äußerte sich in ihrer relativ kurzen Ausführungszeit. Wir hatten für den Wettbewerb vorgegeben, dass die präsentierten Modelle in der Lage sein müssen, innerhalb von neun Stunden insgesamt neun Spielsequenzen von jeweils 30 Minuten Länge vollständig auszuwerten. Das beinhaltet eine Liste je Spiel mit den erfassten Spielereignissen, den dazugehörigen Zeitmarkierungen und eine Evaluierung dieser Ergebnisse. Die Gewinner-Lösung schafft dies in fünf Stunden.“ Damit sei das Kernziel dieses Ideenwettbewerbs erreicht, sagt Weber und erläutert: „Die siegreiche Lösung ist noch nicht produktionsreif, sie dient uns jetzt aber als Benchmark für das, was machbar und realistisch ist. Darauf setzen wir als DFL auf und transformieren es in die Praxis.“

Auch Luccas Roznowicz, Head of Digital Innovations der DFL GmbH, sieht in dem Ergebnis des Wettbewerbs eine Bestätigung für die Innovationsstrategie der DFL. „Als DFL-Gruppe profitieren wir von Challenges dieser Art, weil wir Zugriff auf externes Know-how erhalten, welches wir wiederum in unsere Arbeit einfließen lassen können“, sagt Roznowicz. „Gleichzeitig bieten wir den teilnehmenden Teams eine spannende und in der Form einzigartige Plattform für ihre Innovationskraft. Open Innovation eröffnet so eine Win-Win-Situation für alle Beteiligten.“ Die drei bestplatzierten Teams des Bundesliga Data Shootouts erhielten Preisgelder, ermöglicht unter anderem durch die finanzielle Unterstützung von Amazon Web Services (AWS).

Der Austausch über KI­-basierte Spielereignis-Erkennung hat bei DFL und Sportec Solutions durch diesen Wettbewerb an Fahrt aufgenommen. Ein konkreteres Bild, wie eine zukünftige KI-basierte Automatisierungslösung für die zuverlässige Erfassung von Spielereignisdaten aussehen könnte, wird allmählich sichtbar. So will man in einer künftigen Lösung die Rohdaten aus der automatisierten Erkennung von Ereignisdaten mit den bereits heute verfügbaren Positionsdaten kombinieren, sagt Janetzke.

Und auch für die Preisträger ist das Ergebnis des Wettbewerbs ein schöner Erfolg. „Der erste Platz ist immer etwas Besonderes,“ sagt Pascal Pfeiffer lächelnd. „Die Aussicht, dass unser Ansatz eventuell irgendwann auch in der Praxis genutzt werden könnte, macht es für uns umso spannender.“