Część 2: Wpływ parametrów piłkarza na jego pozycję na boisku.

W pierwszej części przeprowadziliśmy serię eksperymentów mających na celu określenie pozycji piłkarza na boisku na podstawie jego parametrów.

Ich wynik nie był zadowalający, więc postanowiliśmy zmodyfikować nieco podejście i ograniczyć liczbę pozycji do czterech: bramkarze, napastnicy, obrońcy i pomocnicy.

Obecne klasy pozycji przedstawiają się następująco:

  • Napastnicy: ST, CF, RS,RF,LS,LF,LW,RW;
  • Pomocnicy: CDM, LDM,RDM, CM, LCM, RCM, LM, RM, CAM, RAM, LAM, RWB, LWB;
  • Obrońcy: LCB, RCB, CB, LB, RB;
  • Bramkarze: GK;

Dane

Po modyfikacji rozkład pozycji przedstawia się następująco:

Bramkarze: 2025, Napastnicy: 3418, Obrońcy: 5701, Pomocnicy: 7003.

Uczenie modelu

Przyszedł czas na weryfikację, czy wprowadzona przez nas zmiana będzie miała wpływ na ogólną dokładność modelu.

Ponownie sprawdziliśmy kilka algorytmów: las drzew decyzyjnych, dżungla decyzyjna, sieci neuronowe, wieloklasowa regresja logistyczna.  Nasze eksperymenty wzbogaciliśmy o dodatkową walidację modelu. Rozszerzenie polegało na dodaniu sposobu podziału dostępnych danych na treningowe i testowe. W poprzednich podejściach stosowaliśmy prostą walidację, polegającą na podzieleniu zbioru na dane uczące oraz dane testowe w proporcji 70 % – 30%. Teraz również pierwsza seria badań stosowała walidację prostą, ale w kolejnych użyliśmy walidacji krzyżowej K-krotnej (ang. K-fold cross validation). Polega ona na tym, że zbiór danych dzielony jest na K rozłącznych, równych objętościowo zbiorów. Proces trenowania zostaje przeprowadzony K razy, gdzie jeden wyłączony z K zbiorów pełni rolę zbioru testującego, zaś pozostałe łącznie stanowią zbiór trenujący. Po wykonaniu testów ostateczny wynik jest uśredniany. Tym razem najlepsze w predykcji okazały się sieci neuronowe. Ponownie algorytm najlepiej poradził sobie z klasyfikacją bramkarzy.

Podsumowanie

Finalnie udało się dowieść, że przy dobrze opisanych atrybutach graczy piłki nożnej można zastosować algorytmy uczące do przewidywania ich pozycji na boisku. Dokładność na poziomie 0.88 jest w tym przypadku zadowalająca.

 

Komentarze z Facebooka
Jeden komentarz Dodaj swoje

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *