Articles

3rd Down Rouge

Voor de geïnteresseerden is er een Q/A op fivethirtyeight.com waar Elo wordt besproken met betrekking tot de toepassing ervan op NFL football. Hier ben ik een beetje meer beschrijvend dan de Q / A die niet uit te werken in sommige gebieden. Ik raad ook het wikipedia artikel over het Elo rating systeem aan.

Wat is Elo?

Elo is een rating systeem ontworpen voor head-to-head matchups. Het is vernoemd naar de bedenker Arpad Elo, en het is geen acroniem voor iets in het bijzonder.

Elo is ontworpen om mening en marketing uit het beoordelingsproces te halen. Alleen het feitelijke resultaat van een matchup wordt gemeten en bij- of afgetrokken van de rating van een deelnemer. Het helpt om ranglijsten te maken die minder worden beïnvloed door menselijke vooroordelen, behalve natuurlijk de waarden die worden gebruikt om de ranglijst op te stellen. Dat wil niet zeggen dat het vrij is van vooringenomenheid. Wiskundig gezien zal de voorgeschiedenis van een deelnemer altijd, althans tijdelijk, een vertekend beeld geven van zijn beoordeling. Het kan geen rekening houden met een recent ongeval waardoor de deelnemer niet meer in staat is om een eerdere rating te halen. Elo was ook zeer nuttig voordat het internet matchups mogelijk maakte tussen tegenstanders die geografisch ver van elkaar verwijderd waren.

Elo werd populair gemaakt als een schaakrating systeem om de moeilijkheid van het beoordelen en rangschikken van spelers voor competities op te lossen. Als je ooit van een schaakgrootmeester hebt gehoord, is een hoge rating op basis van Elo een belangrijke factor bij het bepalen van hun meesterschap. Voor competitieve doeleinden is het wenselijk dat betere schakers tegen tegenstanders met een vergelijkbare rating spelen. Daarnaast is het voor de ranglijst wenselijk dat hoger opgeleide spelers niet worden beloond voor het in elkaar slaan van lager gerangschikte spelers in een poging hun ranglijst op te vijzelen. Elo is ook ontworpen om om te gaan met de uitdaging dat veel spelers elkaar nooit zullen tegenkomen. Met andere woorden, wanneer het netwerk van matchups schaars is. De grotere schaarste beïnvloedt nog steeds het ranglijstsysteem. Maar competities op een hoger niveau brengen toppers bij elkaar om dit probleem uit te vlakken.

Elo en gelijksoortige afgeleide rankingsystemen worden in veel competitieplatforms gebruikt. Videospelletjes, sport en andere competities hebben het Elo-ratingsysteem aan hun eigen doeleinden aangepast. In feite is de toepassing van het Elo-ratingsysteem op voetbal expressiever dan de toepassing ervan op schaken. Bij schaken is het moeilijker om de sterkte van een overwinning te kwantificeren, aangezien het tellen van stukken of beurten stijl versus sterkte kan aangeven. Terwijl bij voetbal het verschil in punten een relatief goede indicator is voor het verschil in teamkwaliteit, vooral in aanvallende competities zoals de CFL.

Waarom gebruiken?

Elo is in veel opzichten een kwantificering van wat mensen de hele tijd doen met kwalitatieve meningen over teams. We geven krediet aan teams die winnen, en verminderen onze mening over degenen die verliezen. Elo is ook een nulsomspel. Een ploeg die wint krijgt evenveel krediet als de ploeg die verliest. Elo kan ook zo worden aangepast dat underdogs meer krediet krijgen voor een overwinning op een favoriete tegenstander en favorieten minder voor het verslaan van niet-concurrerende tegenstanders.

Elo is ook in veel opzichten expressiever dan alleen winst-verlies kolommen. Winst-verlies kolommen zijn een reductie van informatie tot een enkelvoudig gegeven. Heeft een team verloren, nul punten, of heeft het gewonnen, één punt. In het geval van gelijke standen moet dit worden uitgebreid met halve punten. Ter vergelijking: Elo begint met elk team dat begint met hetzelfde puntentotaal. Dan wordt dit puntentotaal voor elke matchup verhoogd bij winst, of verlaagd bij verlies. Het bedrag van deze verandering begint met een standaardwaarde die dan wordt verhoogd in verhouding tot hoe bevoordeeld de concurrent was om te winnen/verliezen en met hoeveel punten de concurrent won/verloor. In plaats van een enkele waarde, geeft het totaal aantal verdiende/verloren punten meer informatie over het resultaat van de competitie.

Wat zijn de basisprincipes?

Elk team begint met een Elo-rating van 1500. (Wiskundig gezien doet deze specifieke waarde van 1500 er op geen enkele manier toe. Visueel is het echter leuk om een voldoende positieve waarde te hebben, zodat slecht presterende teams niet allemaal negatieve waarden hebben. Je zou met nul kunnen beginnen, als je dat zou willen, of zelfs met een miljoen. In de praktijk wordt dit echter vermeden.)

Daarnaast geven we elk spel een waarde van K = 20. Daarom zal, vóór alle andere factoren, een team dat wint K punten winnen en het andere team zal K punten verliezen. Bijvoorbeeld, als we twee teams hebben team_{A} en team_{B} die concurreren met ratings van ELO^{before}_{team_{A}} = 1500 en ELO^{before}_{team_{B}} = 1500, dan als team_{A} wint dan ELO^{after}_{team_{A}} = 1520 en ELO^{after}_{team_{B}} = 1480. Als ze gelijk eindigen, blijven hun ratings ongewijzigd.

Als we deze formule willen opschonen, ELO^{after} = ELO^{before} + K * WL waarbij WL = 1 als het team gewonnen heeft of WL = -1 als het team verloren heeft.

Waarom kiezen voor K = 20? In veel opzichten heeft K meer invloed dan alleen de waarde om de team rating mee aan te passen. Het beïnvloedt hoe gevoelig de rating van een team is voor een individuele wedstrijd. Hoe groter de waarde, hoe groter de schommeling. In Europees voetbal krijgen verschillende niveaus van evenementen verschillende ratings die proberen de zeldzaamheid van de wedstrijd uit te drukken en hopelijk hoe serieus het deelnemende land het evenement neemt. Zo krijgen evenementen met een hogere rating, zoals de WK-finale, de waarde K=60, terwijl vriendschappelijke wedstrijden de waarde K=20 krijgen.

Winstverwachting?

De winstverwachting is een maatstaf voor de kans dat een team wint van een ander. Meer in het bijzonder, de procentuele kans dat het ene team wint. Als de wedstrijd bijvoorbeeld het opgooien van een munt was, dan zou elk team 50% kansen hebben. Een favoriet team zal een groot aantal hebben dat 100% benadert en een underdog een waarde die 0% benadert.

We zullen een waarde voor de winstverwachting gebruiken om $WL$ uit de bestaande formule te vervangen. In plaats van een team alle punten te geven zoals aangegeven in K zullen we het aanpassen door hoe de team winstverwachting W_{e} zich verhoudt tot het werkelijke winst/verlies resultaat W. Een team dat geen kans heeft om te verliezen, zelfs als ze niet komen opdagen, zou een winstverwachting hebben van W_{e}=100%=1, en een team dat geen kans heeft om te winnen zou W_{e}=0%=0 hebben. Een team dat wint krijgt de volle waarde van een overwinning W=1, een team dat verliest geen waarde W=0, en een team dat gelijk speelt de halve waarde W=0.5.

We bepalen nu het relatieve aantal punten dat aan elke partij in de competitie wordt gegeven op basis van hoe hun resultaat eindigde ten opzichte van hoe ze verwacht werden te eindigen. Twee even teams zouden een W_{e}= 0.5 hebben en daarom zou de winnaar W - W_{e}= 1 - 0.5 = 1/2 van de K punten en de verliezer zou W - 0.5 = -1/2 van K krijgen. Een bevoordeeld team met een W_{e}= 0.75 dat wint zou W - W_{e}= 1 - 0.75 = 1/4 van K, terwijl een winnende underdog met W_{e}= 0.25W - W_{e}= 1- 0.25 = 3/4 van K zou krijgen. Een underdog die omgekeerd verliest, verliest slechts 1/4 van de punten en een evenzo favoriet verliest 3/4 van de punten.
Als we deze formule willen opschonen:


ELO^{after} = ELO^{before} + K * (W - W_{e})
OmW_{e}te bepalen zijn er verschillende methoden. Een ervan is het nemen van een steekproef van de resultaten alvorens de maatstaf van winstverwachting toe te passen. Maak dan een referentietabel van het verschil in Elo-ratings en de kans dat het hoger gerate team wint. Verwijs dan gewoon naar de tabel. U kunt dan de grafiek iteratief aanpassen op basis van de nieuwe ratings die bereikt worden terwijl u de winstverwachting gebruikt, tot de resultaten stabiliseren. Een andere mogelijkheid, maak ik gebruik van de benaderende formule

W_{e} = \frac{1}{10^{\frac{-diff}{400}}+1}

waarbij het verschil in Elo waarden

diff = ELO^{vóór}_{team_{A}} - ELO^{after}_{team_{B}}.

Home field advantage?

Tot nu toe hebben we gecorrigeerd voor één team dat als favoriet wordt beschouwd. Maar intuïtief en statistisch gezien weten we dat er ook een voordeel is aan het spelen van een wedstrijd thuis. Of het nu gaat om reizen, slaap, tijdzones, kleedkamer, of andere zaken. Om hiermee rekening te houden stellen we het verschil naar boven bij met 65 punten voor een thuisploeg en naar beneden met hetzelfde bedrag voor een ploeg op de weg. Het resultaat


diff_{HA} = \begin{cases} diff + 65, \text{ind} locatie = thuis diff - 65, \text{ind} locatie = \verschil, \anders} \Einde{cases}

en

W_{e} = \frac{1}{10^{\frac{-diff_{HA}}{400}}+1}

Voor wat context, de vuistregel is dat65Elo punten ongeveer2.6punten waard is gescoord in een NFL wedstrijd. Hieruit zou je moeten kunnen extrapoleren dat elke25Elo punten één enkel in game punt waard is. Bijvoorbeeld, een verschil in250punten is een theoretische puntenspreiding van10punten.

Deze aanpassing is afkomstig van de fivethirtyeight.com Q/A.

Wat blijft er over? Marge of Victory

We hebben nog een laatste waarde om rekening mee te houden. Dit is het aantal punten waarmee een team wint/verliest, ook wel bekend als de marge van de overwinning. Vaak als een favoriet wint loopt het puntenverschil uit de hand om meer redenen dan het verschil in competitie tussen de teams. Denk maar aan een top vijf college football power five conference team versus een amper mid-major conference team. Wat we willen doen is een vermenigvuldiger mult gebruiken om K aan te passen aan het resultaat van de wedstrijd.

Deze vermenigvuldiger zal uit twee delen bestaan. De eerste zal een afnemend rendement op het puntentotaal toepassen naarmate het scoreverschil groter wordt. Een geschikte wiskundige functie is de natuurlijke logaritme ln. De tweede is een vermenigvuldigingsfactor die afneemt als de Eloof-winnaar groter is dan die van de verliezer en toeneemt als de Eloof-verliezer groter is dan de winnaar.

Voor het eerste deel hebben we de formule

ln(pts_{W}-pts_{L}right|+1)

Een gelijk spel zou danln(1) = 0zijn, wat resulteert in geen multiplier. Een enkel velddoelpunt verschil isln(3+1)en een enkel touchdown verschil isln(7+1). Merk op, dat we de afnemende opbrengsten voor winstpuntverschil kunnen zien doorln(8) = ~2.08ln(15) = ~2.71ln(22) = ~3.09, enln(29) = ~3.37.

Voor de tweede beginnen we met een vermenigvuldigingsfactor van 2.2 en passen die aan op basis van het Elo-verschil diff van het team voor thuis- en uitaanpassing. Het resultaat is {2.2}{2.2+{diff}{1000}}. Deze vermenigvuldiger begint bij 1 en neemt af naarmate de Elo-waarden van de concurrenten verder uit elkaar liggen.

De opgebouwde vermenigvuldigingsfactor is


mult = (ln(pts_{W}-pts_{L}right|+1) * (ƒrac{2.2}{2.2+\frac{diff}{1000}})
Deze vermenigvuldiger is afkomstig van de fivethirtyeight.com Q/A.

Neutraal voorbeeld

Klinkt als een hoop wiskunde.

Hier is een neutraal voorbeeld van twee gemiddelde teams op een neutrale locatie. Met één team dat wint met één touchdown.

We hebben dan twee teams, een winnaar team_{W} en een verliezer team_{L}.

Beide teams beginnen met een gemiddelde ELO ELO^{before}_{team_{W}}=1500 en ELO^{before}_{team_{L}}=1500.

Als resultaat hebben we een differentieel van diff =ELO^{before}_{team_{W}} - ELO^{after}_{team_{L}} = 1500-1500 = 0.

Een neutrale plaatsingswedstrijd betekent diff = diff_{HA} = 0.

De resulterende winstverwachting W_{e} = \frac{1}{10^{\frac{0}{400}}+1} = \frac{1}{10^{0}+1} = \frac{1}{1+1} = 0.5.

Het winnende team krijgt dan W - W_{e} = 1 - 0.5 = 1/2 van K en het verliezende team krijgt W - W_{e} = 0 - 0,5 = -1/2 van K.

De waarde van K zelf is


begin{array}{rl} K * mult = 20 * (ln(pts_{W}-pts_{L}right|+1) * (\frac{2.2}{2.2+{diff}{1000}}) = 20 * (ln(\left|7}}rechts|+1) * (\frac{2.2}{2.2}) = 20 * ln(8) = ~41.59. \Einde {array}
De winnaar heeft dus
ELO^{after}_{team_{W}} = ELO^{before}_{team_{W}} + 0,5 * 41,59 = 1500+{41,59}{2}
terwijl de verliezer
ELO^{after}_{team_{L}} = ELO^{before}_{team_{L}} + (-0.5) * 41.59 = 1500-\frac{41.59}{2}.

Nieuw Seizoen

Om rekening te houden met het personeelsverloop in het tussenseizoen wordt de Elo van een team met een derde verlaagd naar de gemiddelde waarde van 1500.


ELO^{start}_{curr}= (ELO^{eind}_{last}-1500)*frac{2}{3}+1500

Significante CFL EloValues

.Tijd

Naam Elo
Top 0.1% All-Time 1750
Top 1% All-Time 1700
Top 5% All-Time 1600
Top 5% All-Time 1650
Gemiddeld Grey Cup Team 1600
Gemiddeld Conference Finals Team 1575
Gemiddeld Conference Semi-Finals Team 1525

Laat een antwoord achter

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *