W pierwszej części przeprowadziliśmy serię eksperymentów mających na celu określenie pozycji piłkarza na boisku na podstawie jego parametrów.
Ich wynik nie był zadowalający, więc postanowiliśmy zmodyfikować nieco podejście i ograniczyć liczbę pozycji do czterech: bramkarze, napastnicy, obrońcy i pomocnicy.
Obecne klasy pozycji przedstawiają się następująco:
- Napastnicy: ST, CF, RS,RF,LS,LF,LW,RW;
- Pomocnicy: CDM, LDM,RDM, CM, LCM, RCM, LM, RM, CAM, RAM, LAM, RWB, LWB;
- Obrońcy: LCB, RCB, CB, LB, RB;
- Bramkarze: GK;
Dane
Po modyfikacji rozkład pozycji przedstawia się następująco:
Bramkarze: 2025, Napastnicy: 3418, Obrońcy: 5701, Pomocnicy: 7003.
Uczenie modelu
Przyszedł czas na weryfikację, czy wprowadzona przez nas zmiana będzie miała wpływ na ogólną dokładność modelu.
Ponownie sprawdziliśmy kilka algorytmów: las drzew decyzyjnych, dżungla decyzyjna, sieci neuronowe, wieloklasowa regresja logistyczna. Nasze eksperymenty wzbogaciliśmy o dodatkową walidację modelu. Rozszerzenie polegało na dodaniu sposobu podziału dostępnych danych na treningowe i testowe. W poprzednich podejściach stosowaliśmy prostą walidację, polegającą na podzieleniu zbioru na dane uczące oraz dane testowe w proporcji 70 % – 30%. Teraz również pierwsza seria badań stosowała walidację prostą, ale w kolejnych użyliśmy walidacji krzyżowej K-krotnej (ang. K-fold cross validation). Polega ona na tym, że zbiór danych dzielony jest na K rozłącznych, równych objętościowo zbiorów. Proces trenowania zostaje przeprowadzony K razy, gdzie jeden wyłączony z K zbiorów pełni rolę zbioru testującego, zaś pozostałe łącznie stanowią zbiór trenujący. Po wykonaniu testów ostateczny wynik jest uśredniany. Tym razem najlepsze w predykcji okazały się sieci neuronowe. Ponownie algorytm najlepiej poradził sobie z klasyfikacją bramkarzy.
Podsumowanie
Finalnie udało się dowieść, że przy dobrze opisanych atrybutach graczy piłki nożnej można zastosować algorytmy uczące do przewidywania ich pozycji na boisku. Dokładność na poziomie 0.88 jest w tym przypadku zadowalająca.
[…] to zmniejszenie liczby klas do czterech: bramkarze, napastnicy, obrońcy, pomocnicy. W kolejnej części tej serii artykułów postaramy się zmodyfikować eksperyment, aby uzyskać lepszy efekt […]