Articles

3rd Down Rouge

Dla zainteresowanych jest Q/A na fivethirtyeight.com gdzie Elo jest omawiane w odniesieniu do stosowania go do NFL football. Tutaj jestem trochę bardziej opisowy niż Q/A, który nie rozwija się w niektórych obszarach. Polecam również artykuł w wikipedii na temat systemu ratingowego Elo.

Co to jest Elo?

Elo jest systemem ratingowym zaprojektowanym dla head-to-head matchups. Nazwa pochodzi od nazwiska jego twórcy Arpada Elo i nie jest akronimem niczego konkretnego.

Elo został zaprojektowany tak, aby wyeliminować opinie i marketing z procesu oceniania. Tylko rzeczywisty wynik meczu jest mierzony i uznawany lub odejmowany od oceny uczestnika. Pomaga to w tworzeniu systemów rankingowych, na które mniejszy wpływ mają ludzkie uprzedzenia, z wyjątkiem oczywiście tego, jakie wartości są używane do tworzenia rankingu. Nie oznacza to, że jest to system wolny od wszelkich uprzedzeń. Z matematycznego punktu widzenia, przeszła historia uczestnika zawsze będzie, przynajmniej tymczasowo, wpływać na jego ocenę. Nie można brać pod uwagę niedawnego wypadku, który sprawił, że zawodnik nie jest w stanie osiągnąć poprzedniego wyniku. Elo było również bardzo użyteczne zanim internet umożliwił rozgrywanie meczów pomiędzy przeciwnikami, którzy są od siebie bardzo oddaleni geograficznie.

Elo zostało spopularyzowane jako system rankingowy w szachach, aby poradzić sobie z trudnością oceniania i klasyfikowania graczy na zawody. W rzeczywistości, jeśli kiedykolwiek słyszałeś o mistrzu szachowym, wiele z tego, co idzie do określenia ich mistrzostwa jest wysoki Elo oparte rating. Dla celów rywalizacji pożądane jest, aby lepsi szachiści grali z przeciwnikami o podobnym rankingu. Dodatkowo, dla celów rankingowych, pożądane jest, aby gracze o wyższych umiejętnościach nie byli nagradzani za bicie niżej sklasyfikowanych graczy w celu podbicia swojego rankingu. Elo jest również zaprojektowane tak, aby radzić sobie z wyzwaniem, że wielu graczy nigdy nie spotka się ze sobą. Innymi słowy, gdy sieć matchupów jest rzadka. Zwiększona ilość graczy nadal wpływa na system rankingowy. Jednakże, zawody wyższego poziomu gromadzą najlepszych graczy, aby zniwelować ten problem.

Elo i podobne systemy rankingowe są używane na wielu platformach konkursowych. Gry wideo, sport i inne zawody zaadaptowały system rankingowy Elo do swoich celów. W rzeczywistości zastosowanie systemu rankingowego Elo w piłce nożnej jest bardziej wyraziste niż jego zastosowanie w szachach. W szachach trudniej jest określić siłę zwycięstwa, ponieważ liczenie pionów lub obroty mogą wskazywać na styl, a nie siłę. Podczas gdy w futbolu, różnica w punktach jest relatywnie dobrym wskaźnikiem różnicy w jakości drużyny, szczególnie w ligach ofensywnych, takich jak CFL.

Dlaczego warto go używać?

Elo jest na wiele sposobów kwantyfikacją tego, co ludzie robią cały czas z jakościowymi opiniami na temat drużyn. Dajemy kredyt drużynom, które wygrywają i obniżamy naszą opinię o tych, które przegrywają. Elo jest również grą o sumie zerowej. Drużyna, która wygrywa zdobywa tyle samo punktów, ile kosztuje drużyna, która przegrywa. Elo może być również modyfikowane w taki sposób, że drużyny słabsze otrzymują więcej kredytów za zwycięstwo nad faworyzowanym przeciwnikiem, a faworyci otrzymują mniej za pokonanie niekonkurencyjnych przeciwników.

Elo jest również pod wieloma względami bardziej wyraziste niż same kolumny wygranych i przegranych. Kolumny zwycięstw i porażek są redukcją informacji do pojedynczego bitu informacji. Czy drużyna przegrała, zero punktów, czy wygrała, jeden punkt. W przypadku remisów trzeba to rozszerzyć o pół punktu. Dla porównania Elo zaczyna się od tego, że każda drużyna zaczyna z taką samą początkową sumą punktów. Następnie dla każdego meczu suma punktów jest zwiększana przy zwycięstwie lub zmniejszana przy porażce. Wielkość tej zmiany zaczyna się od standardowej wartości, która jest następnie zwiększana w zależności od tego, jak faworyzowany był zawodnik do wygranej/przegranej i o ile punktów wygrał/przegrał. Zamiast pojedynczej wartości, wielopunktowa suma zarobionych/straconych punktów wyraża więcej informacji o wyniku rywalizacji.

Jakie są podstawy?

Każda drużyna zaczyna z rankingiem Elo równym 1500. (Matematycznie, ta konkretna wartość 1500 nie ma żadnego znaczenia. Jednak wizualnie miło jest mieć jeden wystarczająco pozytywny, taki, że zespoły o niskiej wydajności nie mają wszystkich wartości ujemnych. Mógłbyś zacząć od zera, jeśli chcesz, lub nawet od miliona. Jednak w praktyce unika się tego.)

Dodatkowo, nadamy każdej grze wartość K = 20. Zatem, przed wszelkimi innymi czynnikami, drużyna, która wygra, zyska K punkty, a druga drużyna straci K punkty. Na przykład, jeśli mamy dwie drużyny team_{A} i team_{B} konkurujące ze sobą z ratingiem ELO^{before}_{team_{A}} = 1500 i ELO^{before}_{team_{B}} = 1500, wtedy jeśli zespół_{A} wygra to ELO^{after}_{team_{A}} = 1520 i ELO^{after}_{team_{B}} = 1480. Jeśli zremisują, ich oceny pozostaną niezmienione.

Jeśli chcemy oczyścić ten wzór, ELO^{after} = ELO^{before} + K * WL gdzie WL = 1 jeśli drużyna wygrała lub WL = -1 jeśli drużyna przegrała.

Dlaczego wybrać K = 20? Na wiele sposobów K ma większy wpływ niż tylko wartość, o którą należy dostosować ocenę drużyny. Wpływa na to, jak bardzo ocena drużyny jest wrażliwa na poszczególne wydarzenia. Im większa wartość, tym większa fluktuacja. W europejskiej piłce nożnej, różne poziomy rozgrywek otrzymują różne oceny, które próbują wyrazić rzadkość rozgrywek i mają nadzieję, jak poważnie dany kraj traktuje dane wydarzenie. Na przykład, wyżej oceniane wydarzenia, takie jak finały Pucharu Świata otrzymują wartość K=60, podczas gdy mecze towarzyskie otrzymują K=20.

Oczekiwana wygrana?

Oczekiwana wygrana jest miarą tego, jakie są szanse, że jedna drużyna wygra z drugą. Bardziej szczegółowo, procentowa szansa, że jedna z drużyn wygra. Na przykład, gdyby gra była rzucaniem monetą, wtedy każda drużyna miałaby 50% szans. Faworyzowana drużyna będzie miała dużą liczbę zbliżającą się do 100%, a underdog wartość zbliżającą się do 0%.

Użyjemy wartości oczekiwanej wygranej, aby zastąpić $WL$ z istniejącej formuły. Zamiast dawać drużynie wszystkie punkty wskazane w K będziemy dostosowywać je do tego, jak oczekiwana wygrana drużyny W_{e} porównuje się do rzeczywistego wyniku wygranej/porażki W. Drużyna, która nie ma szans na przegraną, nawet gdyby się nie pojawiła, miałaby oczekiwaną wygraną W_{e}=100%=1, a drużyna, która nie ma szans na wygraną, miałaby W_{e}=0. Drużyna, która wygrywa otrzymuje pełną wartość zwycięstwa W=1, drużyna, która przegrywa nie otrzymuje żadnej wartości W=0, a drużyna, która remisuje połowę wartości W=0.5.

Określamy teraz względną ilość punktów przyznawanych każdej stronie w konkursie w oparciu o to, jak ich wynik zakończył się w stosunku do tego, jak oczekiwano, że zakończą. Dwie parzyste drużyny miałyby W_{e}= 0,5 i dlatego zwycięzca otrzymałby W - W_{e}= 1 - 0.5 = 1/2 z K punktów, a przegrany otrzymałby W - 0,5 = -1/2 z K. Faworyzowana drużyna z W_{e}= 0,75 która wygra otrzymałaby W - W_{e}= 1 - 0.75 = 1/4 z K, natomiast underdog wygrywający z W_{e}= 0,25 otrzymałby W - W_{e}= 1- 0,25 = 3/4 z K. Underdog przegrywający odwrotnie traci tylko 1/4 punktów, a analogicznie faworyt traci 3/4 punktów.
Jeśli chcemy oczyścić ten wzór:


ELO^{after} = ELO^{before} + K * (W - W_{e})
Aby wyznaczyćW_{e}istnieje wiele metod. Jedną z nich jest pobranie próbki wyników przed zastosowaniem miary oczekiwanej wygranej. Następnie, zrób tabelę referencyjną różnicy w ocenach Elo i szans na zwycięstwo wyżej notowanej drużyny. Następnie po prostu odnieś się do tabeli. Możesz następnie iteracyjnie dostosowywać tabelę w oparciu o nowe oceny uzyskane przy użyciu wskaźnika oczekiwań zwycięstwa, aż do ustabilizowania się wyników. Alternatywnie, Korzystam z przybliżonego wzoru

W_{e} = \frac{1}{10^{-diff}{400}}+1}

gdzie różnica w wartościach Elo wynosi

diff = ELO^{before}_{team_{A}} - ELO^{after}_{team_{B}}

Przewaga własnego boiska?

Do tej pory dostosowaliśmy się do jednej drużyny, która jest uważana za faworyta. Jednak intuicyjnie i statystycznie wiemy, że istnieje również przewaga za grę w domu. Czy to podróż, sen, strefa czasowa, szatnia, czy inne kwestie. Aby to uwzględnić, zwiększamy różnicę o 65 punktów dla drużyny grającej u siebie i zmniejszamy o tę samą wartość dla drużyny grającej na wyjeździe. W rezultacie


diff_{HA} = \begin{cases} diff + 65, \tekst{if} location = home{cases} diff - 65, \tekst{if} location = Away{cases} diff, \tekst{otherwise} \end{cases}

oraz

W_{e} = \frac{1}{10^{frac{-diff_{HA}}{400}}+1}

Dla pewnego kontekstu, zasada kciuka jest taka, że65punktów Elo jest warte około2,6punktów zdobytych w meczu NFL. Z tego powinieneś być w stanie ekstrapolować, że każdy

25punktów Elo jest warty jeden punkt w grze. Na przykład, różnica w250punktach to teoretyczny rozrzut punktów10punktów.

Ta korekta jest zaczerpnięta z fivethirtyeight.com Q/A.

Co pozostało? Margin of Victory

Pozostała nam jeszcze ostatnia wartość do uwzględnienia. Jest to ilość punktów, o jaką drużyna wygrywa/przegrywa, znana również jako margines zwycięstwa. Często, gdy faworyt wygrywa, różnica punktów wymyka się spod kontroli z wielu powodów, nie tylko z powodu różnicy punktowej między drużynami. Pomyśl o drużynie z pierwszej piątki power five college football i drużynie z zaledwie mid-major conference. To co chcemy zrobić, to użyć mnożnika mult aby dostosować K do wyniku gry.

Ten mnożnik będzie miał dwie części. Pierwsza z nich będzie stosować malejące zwroty na sumie punktów, gdy różnica w wyniku będzie się zwiększać. Dobrze dopasowaną funkcją matematyczną jest logarytm naturalny ln. Drugi to mnożnik, który maleje, gdy Eloof zwycięzcy jest większy niż przegranego i rośnie, gdy Eloof przegranego jest większy niż zwycięzcy.

Dla pierwszej części mamy wzór

ln(lewa|pts_{W}-pts_{L}right|+1)

Gra na remis miałaby wtedy postaćln(1) = 0co powoduje brak mnożnika. Pojedyncza różnica bramek toln(3+1), a pojedyncza różnica przyłożeń toln(7+1). Zauważmy, że możemy zauważyć malejące zwroty dla różnicy punktów zwycięstwa oln(8) = ~2.08ln(15) = ~2,71ln(22) = ~3,09, orazln(29) = ~3.37.

Dla drugiego, zaczynamy z mnożnikiem 2.2 i dostosowujemy go w oparciu o różnicę Elo drużyny diff przed korektą w domu i na wyjeździe. Wynikiem jest frac{2.2}{2.2+frac{diff}{1000}}. Mnożnik ten zaczyna się od 1 i maleje wraz z oddalaniem się od siebie wartości Elo zawodników.

Skumulowany mnożnik to


mult = (ln(\left|pts_{W}-pts_{L}right|+1) * (\frac{2.2}{2.2+(\frac{diff}{1000}})
Ten mnożnik jest wyciągnięty z fivethirtyeight.com Q/A.

Przykład neutralny

Brzmi jak dużo matematyki.

Oto neutralny przykład dwóch przeciętnych drużyn w neutralnym miejscu. Z jedną drużyną wygrywającą przez jedno przyłożenie.

Będziemy mieli dwie drużyny, zwycięzcę team_{W} i przegranego team_{L}.

Oba zespoły zaczynają ze średnią ELO ELO^{before}_{team_{W}}=1500 i ELO^{before}_{team_{L}}=1500.

W rezultacie mamy różnicę diff =ELO^{before}_{team_{W}} - ELO^{after}_{team_{L}} = 1500-1500 = 0.

Gra na neutralnym terenie oznacza diff = diff_{HA} = 0.

Wynikająca z tego oczekiwana wygrana W_{e} = \frac{1}{10^{\frac{0}{400}}+1} = \frac{1}{10^{0}+1} = \frac{1}{1+1} = 0.5.

Zwycięska drużyna otrzyma wtedy W - W_{e} = 1 - 0.5 = 1/2 z K a drużyna przegrana otrzyma W - W_{e} = 0 - 0,5 = -1/2 z K.

Wartość K sama w sobie wynosi


\begin{array}{rl} K * mult = & 20 * (ln(\left|pts_{W}-pts_{L}\right|+1) * (\frac{2.2}{2.2+\frac{diff}{1000}}) \\ = & 20 * (ln(\left|7\right|+1) * (\frac{2.2}{2.2}) = 20 * ln(8) \\ = & ~41.59. \end{array} \begin{array}{rl} K * mult = & 20 * (ln(\left|pts_{W}-pts_{L}\right|+1) * (\frac{2.2}{2.2+\frac{diff}{1000}}) \\ = & 20 * (ln(\left|7\right|+1) * (\frac{2.2}{2.2}) = 20 * ln(8) \\ = & ~41.59. \end{array} egin{array}{rl} K * mult = 20 * (ln(\left|pts_{W}-pts_{L}}right|+1) * (\frac{2.2}{2.2+}) = 20 * (ln(\left|7\right|+1) * (\frac{2.2}{2.2}) = 20 * ln(8) = ~41.59. \end{array}
Zwycięzca będzie miał zatem
ELO^{after}_{team_{W}} = ELO^{before}_{team_{W}} + 0,5 * 41,59 = 1500+prac{41,59}{2}
podczas gdy przegrany będzie miał
ELO^{after}_{team_{L}} = ELO^{before}_{team_{L}} + (-0.5) * 41.59 = 1500-{41.59}{2}.

Nowy sezon

Aby uwzględnić rotację personelu poza sezonem, Elo drużyny jest regresowane do średniej wartości 1500 o jedną trzecią.


ELO^{start}_{curr}= (ELO^{end}_{last}-)1500)*frac{2}{3}+1500

Ważne wartości CFL EloValues

Nazwisko Elo
Top 0.1% All-Time 1750
Top 1% All-Time 1700
Top 5% All-Time 1650
Average Grey Cup Team 1600
Average Conference Finals Team 1575
Average Conference Semi-Finałów 1525

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *