Michał Jaroń: Piłka nożna cierpi z braku danych

Analityk piłki nożnej Michał Jaroń stara się naukowo uzasadnić geniusz Leo Messiego, klasę bocznego obrońcy i bramkarza oraz przypomina to, co powiedział Johan Cruyff: z piłką przy nodze jestem przez 3 minuty w meczu, ważne, co robię przez pozostałe 87 minut.

Publikacja: 08.05.2020 10:00

Michał Jaroń: Piłka nożna cierpi z braku danych

Foto: AFP

Plus Minus: Czym zajmuje się w piłce nożnej ktoś taki jak pan?

Michał Jaroń: Zacznijmy od tego, że trzeba odróżnić analityka piłkarskiego od analityka danych piłkarskich. Ten pierwszy to osoba, która ogląda setki meczów i wyciąga wnioski co do taktyki i zalet drużyn. Analiza danych to z kolei coś, czym ja się zajmowałem w Legii Warszawa. Tutaj jest bardziej naukowe podejście, a taka osoba niekoniecznie musi mieć podbudowę piłkarską. Ważniejsze są umiejętności analityczne, statystyczne czy też programistyczne. Analityk danych piłkarskich stara się wprowadzić element obiektywizmu do futbolu, opierając się na liczbach. Pokuszę się nawet o stwierdzenie, że doświadczenie czysto piłkarskie na tym stanowisku czasem może być ciężarem.

Przez dwa lata współpracował pan z Legią Warszawa...

Legia była i jest w czołówce klubów ekstraklasy pod względem innowacji. Początkowo trudno było nawet nazwać moje stanowisko. Ostatecznie stanęło na „analityk big data". Wracając do roli analityka – co klub, to inne zadania. Można się zajmować prostszą analizą stricte statystyczną na podstawie zmiennych, takich jak liczba oddanych strzałów, zdobytych goli, przewidywać, jaka jest wartość zawodnika. Z drugiej strony bardziej złożoną analizą danych piłkarskich zajmują się już poważni naukowcy. Na prestiżowych uczelniach są osoby, które się doktoryzują i właściwie opierają swoje kariery naukowe na piłce.

Można pokazać w liczbach, dlaczego Leo Messi czy Cristiano Ronaldo są najlepsi, a Andrea Pirlo był mistrzem elegancji?

Najwięksi magicy wymykają się w pewnym stopniu próbom naukowego opisu, zawsze zostaje miejsce na geniusz i iskrę bożą. Z założenia powinno to jednak dotyczyć nielicznych graczy. W statystyce zresztą nie chodzi o to, by mieć zawsze rację, ale o to, by mieć ją wystarczająco często. Są sporty, które łatwiej opisuje się liczbami, np.: koszykówka, futbol amerykański czy baseball. Futbol opisać trudniej, bo jest tam stosunkowo mało tzw. wydarzeń ważnych, czyli goli i strzałów. W ostatnich latach odchodzi się od analizy pojedynczych zdarzeń na rzecz analizy przestrzennej. Na przykład – jak często zawodnik się uwalniał od krycia, jak wiele przestrzeni kreuje. Naukowcy z Barcelona Innovation Hub opracowali model, który na podstawie tego, jak ktoś biega, jak się ustawia, oblicza, ile przestrzeni stwarza swoim kolegom. Johan Cruyff mówił, że z piłką przy nodze jest przez 3 minuty w meczu, ważne, co robi przez pozostałe 87 minut.

Tu Messi jest najlepszy?

W ataku po części chodzi o zdobywanie przestrzeni i modele faktycznie pokazują, że Messi, stojąc, tworzy więcej przestrzeni, niż inni biegając. Cały czas obserwuje boisko i mądrze się ustawia.

Jeśli przeciętny piłkarz zacznie się ustawiać jak Messi, to chyba niekoniecznie uzyska ten sam efekt. Do Argentyńczyka podbiegnie dwóch piłkarzy, do kogoś innego – jeden...

Da się jednak wyprowadzić uniwersalne wzorce mądrego ustawiania się i zobaczyć, co przynosi korzyść. Co prawda na ogół analityka stara się modelować uśrednione zachowania, ale wpływ gwiazd też się szacuje – analizuje się, czy jedna gwiazda w drużynie zmienia sposób gry czy skupia na sobie uwagę rywali.

W analizie danych piłkarskich też są trendy i mody?

Oczywiście, co więcej, te trendy bardzo szybko się zmieniają. Ma na to wpływ dostępność nowych danych, ich upowszechnienie. Teraz w analizach uwzględnia się nawet to, w jakiej pozycji jest ciało zawodnika w danym momencie akcji. To ważne, czy zawodnik stoi na nodze postawnej, czy jest wychylony, czy obrócony w prawo. Jeśli jest odwrócony plecami do akcji, to więcej czasu zajmie mu zareagowanie.

Tych danych, liczb są całe arkusze. W czasie meczu mogą być przydatne?

Paradoksalnie futbol ciągle cierpi z powodu braku danych. Obecnie analizy w czasie rzeczywistym są raczej rzadkością. Jeśli ktoś to robi, to się tym nie chwali, bo to faktycznie dawałoby potężną przewagę. Może takie obliczenia robią specjaliści w Liverpoolu albo w Barcelonie? Niektóre modele potrzebują czasu, żeby wyprodukować wyniki, żeby wszystko przeliczyć. Trzeba też zwrócić uwagę, że najważniejsze dane w analizie – pozycje zawodników w każdej sekundzie meczu – tak naprawdę nie są powszechnie dostępne. Jest to jedna z barier, które powodują, że futbol pozostał w tyle względem innych dyscyplin. W koszykówce systemy sztucznej inteligencji przetwarzające obrazy mają prostsze zadanie. Kamera jest bliżej, boisko mniejsze, na ogół wszyscy mieszczą się w kadrze. W piłce nożnej tak nie jest, widzimy tylko wycinek, a często nawet ludzkim okiem nie jesteśmy w stanie rozróżnić postaci, choćby w tłoku przy rzutach rożnych.

Jak to wygląda w Ekstraklasie?

Dostępny jest system TRACAB, który działa dobrze, ale udostępnia tylko dane o liczbie przebiegniętych kilometrów, sprintów itp. Ten system pomimo światowej popularności ciągle wymaga przetworzenia, po meczu ktoś musi sprawdzić, czy nie ma kuriozalnych pomyłek i np. na podstawie obrazu kamery algorytm nie pomylił bramkarza z napastnikiem przeciwnej drużyny. To generuje dodatkowe koszty i w Ekstraklasie nikt nie ma dostępu do pełnych danych TRACAB. Wracając do danych w czasie rzeczywistym – już powszechnie, także w Ekstraklasie, patrzy się na odczyty kamizelek, które gracze zakładają, i na tej podstawie podejmuje się decyzje o zmianie, jeśli ktoś jest zmęczony. Tylko że w danych o przebiegniętych kilometrach brakuje kontekstu. Takie suche dane są mało przydatne. Nawet liczba sprintów nie mówi wszystkiego o grze. Nie wiemy, czy ktoś biegł szybko, bo wcześniej się spóźnił z interwencją, czy pędził do kontrataku. Są nawet prace, które pokazują, że lepsza drużyna niekoniecznie biega więcej. W Polsce utarło się powiedzenie, że jak piłkarze mniej biegali i przegrali, to znaczy, że nie walczyli, ale kilometry zależą czasem od taktyki i od tego, jak się mecz układa.

Polskich klubów nie stać na Messiego, ale pewnie stać na świetnych analityków. Można tak próbować gonić Zachód?

Oczywiście, bo łatwiej zatrudnić naukowca niż piłkarza. Jedna z firm konsultingowych, doradzających klubom piłkarskim, pokusiła się o oszacowanie, jak zainwestowane 100 tys. euro przekłada się na dodatkowe punkty w trakcie sezonu. Wyszło z tego, że wydanie tej sumy na nowego piłkarza czy zwiększenie komuś pensji daje tylko 0,3 pkt w sezonie. Rozszerzenie działu analitycznego to już 1,7 pkt więcej. Drugie miejsce zajęły wydatki na rozwój akademii. Niestety polskie kluby nie chcą iść tą drogą. Pewnie w Polsce jest tak, że wiele osób uczestniczących w całym łańcuchu transferowym z trudem przełknęłoby fakt, że zatrudniani są analitycy i z obiegu „wycieka" część gotówki. To jednak moja prywatna interpretacja. Jednym z celów analityki powinno być również znajdowanie potencjalnych celów transferowych, najlepiej graczy tanich, często niedocenianych. Taka zmiana filozofii zapewne też nie byłaby łatwa dla części środowiska. Ale ciągle największą barierą jest nieufność do metod analitycznych, które traktuje się bardziej jako ciekawostkę niż realne pole do rozwoju. Barierą w myśleniu może być też fakt, że analityka to inwestycja, która niekoniecznie spłaci się od razu. Potrzeba zaufania i długofalowej strategii.

Messiego łatwo przedstawić w liczbach jako geniusza. A co z bocznymi obrońcami?

Można tworzyć modele przestrzenne i patrzeć, jak taki obrońca zyskiwał czy tracił pole, jak przecinał linię podań i swoimi zachowaniami zmniejszał prawdopodobieństwo straty gola. Przez lata analizowano głównie zawodników ofensywnych, bo tutaj dane są łatwiejsze do zbadania. Dla defensywy najważniejsze aspekty są trudniejsze do zmierzenia, często dosyć ulotne. Można analizować przejęcie piłki, bloki i porównać z innymi piłkarzami z danej ligi, ale to dane pozbawione kontekstu. Odzyskanie piłki wślizgiem powinniśmy traktować jako pozytywne wydarzenie, a z drugiej strony Paolo Maldini mawiał, że każdy wślizg wynika z wcześniejszego błędu albo braku umiejętności.

Są jeszcze obszary, które zostały do zmierzenia?

Powiedziałbym nawet, że do analityki piłkarskiej, jak do żadnego innego sportu, pasuje powiedzenie, że to, co wiemy, jest tylko kropelką w oceanie tego, czego nie wiemy. Potężnym obszarem do badań są np. położenie piłki i pozycja zawodników względem niej. Ważną funkcją analityki jest szukanie nowego sensu w potencjalnie znanych od dawna zagadnieniach. Weźmy choćby podania – obserwuję tendencję do traktowania procentu skutecznych podań jako wyznacznika umiejętności zawodnika. Taka analiza jest niewiele warta, ponieważ nie wiemy, czy gracz wykonywał trudne podania, czy wybierał najprostsze opcje i tym samym notował wiele celnych podań. To samo odnosi się do dryblingów. Często tworzone są rankingi liczby dryblingów i na ich podstawie stwierdza się, czy zawodnik jest bardziej kreatywny, zyskuje przestrzeń. Sucha liczba dryblingów zaciemnia jednak obraz, powinniśmy raczej zapytać, czy takie zagranie pozwoliło przenieść piłkę w groźne strefy. Już nawet analiza tego, co zawodnik zrobił z piłką bezpośrednio po dryblingu, może wiele powiedzieć o jego umiejętnościach. Należy pamiętać również o szerokim strumieniu danych kondycyjnych, które można wykorzystać do maksymalizacji formy fizycznej czy też przewidywania kontuzji.

Co to jest packing, termin często używany przez analityków?

To w uproszczeniu zliczanie, ilu graczy drużyny przeciwnej minęło podanie, co dobrze szacuje poziom zawodnika, zatem może być użyte do wyławiania perspektywicznych piłkarzy. Robiłem taką analizę dla obecnego sezonu Ekstraklasy, bardzo dobrze wypadają w niej Hubert Matynia i Jarosław Jach. Wspomniani gracze może nie mają najlepszych liczb, w rozumieniu klasycznych statystyk, jednak jak widzimy, są narzędzia pozwalające docenić ich prawdziwy kunszt. Sprawdzałem też, jak radzi sobie zawodnik, wykonując podanie pod presją, tutaj najlepiej wypada Janusz Gol, ale w czołówce, co cieszy, są młodzi – Kamil Jóźwiak i Bartosz Slisz.

Bramkarze w analizach są pokrzywdzeni?

Niekoniecznie. Patrzymy, w który sektor bramki piłka była uderzona, jak bramkarz był ustawiony i z jakim prawdopodobieństwem powinien obronić strzał. Możemy dzięki temu wskazać, czy puścił więcej goli, niż powinien. Kiedy Swansea spadało z Premier League, Fabiański był w czołówce bramkarzy. Dużo goli puszczał, ale i tak bronił więcej, niż powinien. Był trzecim najlepszym bramkarzem w Premier League. Przed nim był m.in. David De Gea, ale za nim Thibault Courtois. Eksperymentowałem kiedyś z modelem, który ocenia, jakie błędy przy ustawieniu popełnia bramkarz. U Fabiańskiego liczby pokazują, że ustawianie się na boisku jest jego mocną stroną.

Jak będzie wyglądać analityka w najbliższych latach?

Do najważniejszych osób w futbolu dociera znaczenie analizy danych. Rozsądne ich wykorzystanie pozwoli zminimalizować różnice wynikające z dysproporcji budżetów. W ciągu najbliższych dziesięciu lat wiele uznanych klubów może dużo stracić, ponieważ nie docenią znaczenia analizy danych.

x

Plus Minus

Prenumerata sobotniego wydania „Rzeczpospolitej”:
prenumerata.rp.pl/plusminus
tel. 800 12 01 95

Plus Minus: Czym zajmuje się w piłce nożnej ktoś taki jak pan?

Michał Jaroń: Zacznijmy od tego, że trzeba odróżnić analityka piłkarskiego od analityka danych piłkarskich. Ten pierwszy to osoba, która ogląda setki meczów i wyciąga wnioski co do taktyki i zalet drużyn. Analiza danych to z kolei coś, czym ja się zajmowałem w Legii Warszawa. Tutaj jest bardziej naukowe podejście, a taka osoba niekoniecznie musi mieć podbudowę piłkarską. Ważniejsze są umiejętności analityczne, statystyczne czy też programistyczne. Analityk danych piłkarskich stara się wprowadzić element obiektywizmu do futbolu, opierając się na liczbach. Pokuszę się nawet o stwierdzenie, że doświadczenie czysto piłkarskie na tym stanowisku czasem może być ciężarem.

Pozostało 93% artykułu
Plus Minus
Bogusław Chrabota: Dlaczego broń jądrowa nie zostanie użyta
Plus Minus
„Empire of the Ants”: 103 683 zwiedza okolicę
Plus Minus
„Chłopi”: Chłopki według Reymonta
Plus Minus
„Największe idee we Wszechświecie”: Ruch jest wszystkim!
Materiał Promocyjny
Klimat a portfele: Czy koszty transformacji zniechęcą Europejczyków?
Plus Minus
„Nieumarli”: Noc żywych bliskich