Articles

3rd Down Rouge

Pour ceux qui sont intéressés, il y a une Q/A à fivethirtyeight.com où Elo est discuté en ce qui concerne son application au football NFL. Ici, je suis un peu plus descriptif que la Q/A qui ne parvient pas à élaborer dans certains domaines. Je recommande également l’article de wikipedia sur le système d’évaluation Elo.

Qu’est-ce qu’Elo?

Elo est un système d’évaluation conçu pour les matchs en tête-à-tête. Il porte le nom de son créateur, Arpad Elo, et n’est pas un acronyme pour quelque chose en particulier.

Elo est conçu pour retirer l’opinion et le marketing du processus de notation. Seul le résultat réel d’un match est mesuré et crédité ou débité de la note des participants. Il aide à former des systèmes de classement moins influencés par les biais humains, sauf, bien sûr, quelles valeurs sont utilisées pour former la notation. Cela ne veut pas dire qu’il est exempt de tout préjugé. Mathématiquement, l’histoire passée du participant va toujours, au moins temporairement, biaiser son classement. Il n’est pas possible de tenir compte d’un accident récent qui a rendu le concurrent incapable de réaliser les mêmes performances qu’auparavant. Elo était également très utile avant qu’internet ne permette des rencontres entre des adversaires éloignés géographiquement.

Elo a été popularisé comme système de notation des échecs pour faire face à la difficulté de noter et de classer les joueurs pour les compétitions. En fait, si vous avez déjà entendu parler d’un maître d’échecs, une grande partie de ce qui entre en ligne de compte pour déterminer leur maîtrise est un classement élevé basé sur Elo. Il est souhaitable, à des fins de compétition, que les meilleurs joueurs d’échecs jouent contre des adversaires de même niveau. De plus, pour les besoins du classement, il est souhaitable que les joueurs les plus qualifiés ne soient pas récompensés pour avoir battu des joueurs moins bien classés dans le but de gonfler leur classement. Elo est également conçu pour faire face au fait que de nombreux joueurs ne se rencontreront jamais. En d’autres termes, lorsque le réseau de rencontres est clairsemé. Cette rareté accrue biaise toujours le système de classement. Cependant, les compétitions de niveau supérieur rassemblent les meilleurs joueurs pour niveler ce problème.

L’Elo et les systèmes de classement dérivés similaires sont utilisés sur de nombreuses plateformes de compétition. Les jeux vidéo, les sports et d’autres compétitions ont adapté le système de classement Elo à leurs objectifs. En fait, l’application du système de classement Elo au football est plus expressive que son application aux échecs. Aux échecs, il est plus difficile de quantifier la force d’une victoire, car le nombre de pièces ou de tours peut indiquer le style par rapport à la force. Alors que, dans le football, le différentiel de points est un indicateur relativement bon de la différence de qualité des équipes, en particulier dans les ligues offensives comme la CFL.

Pourquoi l’utiliser ?

L’Elo est à bien des égards une quantification de ce que les humains font tout le temps avec des opinions qualitatives sur les équipes. Nous donnons du crédit aux équipes qui gagnent, et réduisons notre opinion sur celles qui perdent. Elo est également un jeu à somme nulle. Une équipe qui gagne gagne la même quantité de crédit que coûte l’équipe qui perd. Elo peut également être modifié de telle sorte que les outsiders obtiennent plus de crédit pour une victoire sur un adversaire favorisé et que les favoris gagnent moins pour avoir battu des adversaires non compétitifs.

Elo est également, à bien des égards, plus expressif que les colonnes de victoires et de défaites seules. Les colonnes de victoires-défaites sont une réduction de l’information en un élément d’information singulier. Une équipe a-t-elle perdu, zéro point, ou a-t-elle gagné, un point. En cas d’égalité, cette information doit être élargie pour tenir compte des demi-points. En comparaison, Elo part du principe que chaque équipe a le même nombre de points au départ. Ensuite, pour chaque rencontre, ce total de points est augmenté en cas de victoire ou diminué en cas de défaite. Le montant de ce changement commence par une valeur standard qui est ensuite augmentée en fonction de la probabilité de victoire ou de défaite du concurrent et du nombre de points gagnés ou perdus par le concurrent. Plutôt qu’une valeur unique, le total de plusieurs points gagnés/perdus exprime davantage d’informations sur le résultat de la compétition.

Quels sont les principes de base?

Chaque équipe commence avec une cote Elo de 1500. (Mathématiquement, cette valeur spécifique réelle de 1500 n’a aucune importance. Cependant, il est agréable visuellement d’en avoir une suffisamment positive pour que les équipes peu performantes n’aient pas toutes des valeurs négatives. Vous pourriez commencer à zéro, si vous le souhaitez, ou même à un million. Cependant, en pratique, on évite cela.)

En outre, nous donnerons à chaque jeu une valeur de K = 20. Ainsi, avant tout autre facteur, une équipe qui gagne gagnera K points et l’autre équipe perdra K points. Par exemple, si nous avons deux équipes équipe_{A} et équipe_{B} en compétition avec des évaluations de ELO^{avant}_{team_{A}} = 1500 et ELO^{avant}_{team_{B}} = 1500, puis si équipe_{A} gagne alors ELO^{après}_{team_{A}} = 1520 et ELO^{après}_{team_{B}} = 1480. En cas d’égalité, leurs classements resteraient inchangés.

Si nous voulons nettoyer cette formule, ELO^{after} = ELO^{before} + K * WLWL = 1 si l’équipe a gagné ou WL = -1 si l’équipe a perdu.

Pourquoi choisir K = 20 ? À bien des égards, K a plus d’influence que la simple valeur par laquelle ajuster le classement d’une équipe. Il affecte la façon dont la cote d’une équipe réagit à un événement de compétition individuel. Plus la valeur est grande, plus la fluctuation est importante. Dans le football européen, les différents niveaux d’événements reçoivent des notes différentes qui tentent d’exprimer la rareté de la compétition et, espérons-le, le sérieux avec lequel le pays participant prend l’événement. Par exemple, les événements les mieux notés, comme les finales de la Coupe du monde, obtiennent une valeur K=60, tandis que les matchs amicaux se voient attribuer K=20.

L’espérance de gain?

L’espérance de gain est une mesure de ce que sont les chances qu’une équipe gagne contre une autre. Plus particulièrement, le pourcentage de chance qu’une équipe gagne. Par exemple, si le jeu consistait à tirer à pile ou face, alors chaque équipe aurait 50\% de chances. Une équipe favorisée aura un grand nombre approchant 100\% et un outsider une valeur approchant 0\%.

Nous utiliserons une valeur d’espérance de victoire pour remplacer $WL$ de la formule existante. Au lieu de donner à une équipe tous les points indiqués dans K, nous l’ajusterons en fonction de la façon dont l’espérance de victoire des équipes W_{e} se compare au résultat réel de la victoire/perte W. Une équipe qui n’a aucune chance de perdre, même si elle ne s’est pas présentée, aurait une espérance de victoire de W_{e}=100\%=1, et une équipe qui n’a aucune chance de gagner aurait W_{e}=0\%=0. Une équipe qui gagne obtient la pleine valeur d’une victoire W=1, une équipe qui perd aucune valeur W=0, et une équipe qui fait match nul la moitié de la valeur W=0.5.

Nous déterminons maintenant la quantité relative de points attribués à chaque partie de la compétition en fonction de la façon dont leur résultat a fini par rapport à la façon dont ils étaient censés finir. Deux équipes paires auraient un W_{e}= 0,5 et donc le gagnant recevrait W - W_{e}= 1 - 0.5 = 1/2 des K points et le perdant recevrait W - 0,5 = -1/2 de K. Une équipe favorisée avec un W_{e}= 0,75 qui gagne obtiendrait W - W_{e}= 1 - 0.75 = 1/4 de K, tandis qu’un underdog gagnant avec W_{e}= 0,25 obtiendrait W - W_{e}= 1- 0,25 = 3/4 de K. Un outsider perdant inversement ne perd que 1/4 des points et un favori de même perd 3/4 des points.
Si on veut nettoyer cette formule :


ELO^{after} = ELO^{before} + K * (W - W_{e})
Pour déterminerW_{e}, il existe plusieurs méthodes. La première consiste à prendre un échantillon des résultats avant d’appliquer la mesure de l’espérance de gain. Ensuite, faites un tableau de référence de la différence de classement Elo et des chances de victoire de l’équipe la mieux classée. Ensuite, il suffit de référencer le tableau. Vous pouvez ensuite ajuster itérativement le tableau en fonction des nouvelles cotes obtenues en utilisant l’espérance de victoire jusqu’à ce que les résultats se stabilisent. Autre possibilité, Je fais usage de la formule approximative

W_{e} = \frac{1}{10^{\frac{-diff}{400}}+1}

où le différentiel des valeurs Elo est

diff = ELO^{avant}_{team_{A}} - ELO^{après}_{équipe_{B}}

Avantage du terrain d’accueil?

Jusqu’ici, nous avons ajusté en fonction d’une équipe considérée comme favorite. Cependant, intuitivement et statistiquement, nous savons qu’il y a aussi un avantage à jouer un match à domicile. Que ce soit le voyage, le sommeil, les fuseaux horaires, les vestiaires ou d’autres questions. Le compte pour cela nous ajustons le différentiel vers le haut par 65 points pour une équipe à domicile et vers le bas par le même montant pour une équipe sur la route. En conséquence


diff_{HA} = \begin{cases} diff + 65, \text{if } location = Home\\\\ diff - 65, \text{if } location = Away\\ diff, \text{ else} \end{cases}

et

W_{e} = \frac{1}{10^{\frac{-diff_{HA}}{400}}+1}

Pour un peu de contexte, la règle empirique est que65points Elo valent environ2,6points marqués dans un match de NFL. A partir de là, vous devriez pouvoir extrapoler que chaque25points Elo vaut un seul point en match. Par exemple, un différentiel de250points correspond à un écart de points théorique de10points.

Cet ajustement est tiré du Q/A de fivethirtyeight.com.

Que reste-t-il ? La marge de victoire

Il nous reste une dernière valeur à prendre en compte. Il s’agit du nombre de points par lesquels une équipe gagne/perd, également connu sous le nom de marge de victoire. Souvent, lorsqu’un favori gagne, le différentiel de points devient incontrôlable pour d’autres raisons que le différentiel de compétitivité des équipes. Pensez à une équipe de la conférence des cinq premières puissances du football universitaire contre une équipe de la conférence des moyennes majeures. Ce que nous voulons faire, c’est utiliser un multiplicateur mult pour ajuster K au résultat du match.

Ce multiplicateur aura deux parties. La première appliquera des rendements décroissants sur le total de points au fur et à mesure que le différentiel pour le score devient plus grand. Une fonction mathématique bien adaptée est le logarithme naturel ln. La seconde est un multiplicateur qui diminue lorsque l’Eloof gagnant est plus grand que celui du perdant et augmente lorsque l’Eloof perdant est plus grand que le gagnant.

Pour la première partie, nous avons la formule

ln(\left|pts_{W}-pts_{L}\right|+1)

Un match nul serait alorsln(1) = 0ce qui n’entraîne aucun multiplicateur. Une différence de field goal simple estln(3+1)et une différence de touchdown simple estln(7+1). Remarque, nous pouvons voir les rendements décroissants pour le différentiel de points de victoire parln(8) = ~2.08ln(15) = ~2,71ln(22) = ~3,09, etln(29) = ~3.37.

Pour le second, nous partons d’un multiplicateur de 2,2 et l’ajustons en fonction du différentiel Elo de l’équipe diff avant l’ajustement domicile et extérieur. Le résultat est \frac{2.2}{2.2+\frac{diff}{1000}}. Ce multiplicateur commence à 1 et diminue à mesure que les valeurs Elo des concurrents s’éloignent.

Le multiplicateur cumulé est


mult = (ln(\left|pts_{W}-pts_{L}\right|+1) * (\frac{2.2}{2.2+\frac{diff}{1000}})
Ce multiplicateur est tiré du Q/A de fivethirtyeight.com.

Exemple neutre

Cela semble être beaucoup de mathématiques.

Voici un exemple neutre de deux équipes moyennes sur un site neutre. Avec une équipe qui gagne par un seul touchdown.

Nous aurons deux équipes, un gagnant équipe_{W} et un perdant équipe_{L}.

Les deux équipes commencent avec un ELO moyen ELO^{avant}_{team_{W}}=1500 et ELO^{avant}_{team_{L}}=1500.

En conséquence, nous avons un différentiel de diff =ELO^{avant}_{team_{W}}. - ELO^{après}_{équipe_{L}} = 1500-1500 = 0.

Un match sur site neutre signifie diff = diff_{HA} = 0.

L’espérance de victoire résultante W_{e} = \frac{1}{10^{\frac{0}{400}}+1} = \frac{1}{10^{0}+1} = \frac{1}{1+1} = 0.5.

L’équipe gagnante obtiendra alors W - W_{e} = 1 - 0.5 = 1/2 de K et l’équipe perdante obtiendra W - W_{e} = 0 - 0,5 = -1/2 de K.

La valeur de K elle-même est


\begin{array}{rl} K * mult = 20 * (ln(\left|pts_{W}-pts_{L}\right|+1) * (\frac{2.2}{2.2+\frac{diff}{1000}}) \\\\\N = 20 * (ln(\left|7\right|+1) * (\frac{2.2}{2.2}) = 20 * ln(8) \N = ~41.59. \end{array}
Le gagnant aura donc
ELO^{après}_{équipe_{W}} = ELO^{avant}_{équipe_{W}} + 0,5 * 41,59 = 1500+\frac{41,59}{2}
alors que le perdant aura
ELO^{after}_{team_{L} = ELO^{before}_{team_{L} + (-0,5) * 41,59 = 1500-\frac{41,59}{2}.

Nouvelle saison

Pour tenir compte du roulement de personnel de l’intersaison, l’Elo d’une équipe est régressé vers la valeur moyenne de 1500 par un tiers.


ELO^{start}_{curr}= (ELO^{end}_{last}-1500)*\frac{2}{3}+1500

Valeurs Elo significatives des LFC

Nom Elo
Top 0.1% All-Time 1750
Top 1% All-Time 1700
Top 5% All-.temps 1650
Équipe moyenne de la Coupe Grey 1600
Équipe moyenne des finales de conférence 1575
Équipe moyenne des demi-finales de conférence .Finals Team 1525

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *