Articles

3rd Down Rouge

Para los interesados hay un Q/A en fivethirtyeight.com donde se habla de Elo en cuanto a su aplicación al fútbol de la NFL. Aquí soy un poco más descriptivo que el Q/A que falla en la elaboración de algunas áreas. También recomiendo el artículo de wikipedia sobre el sistema de clasificación Elo.

¿Qué es Elo?

Elo es un sistema de clasificación diseñado para los enfrentamientos cara a cara. Lleva el nombre de su creador, Arpad Elo, y no es un acrónimo de nada en particular.

Elo está diseñado para eliminar la opinión y el marketing del proceso de clasificación. Sólo se mide el resultado real de un partido y se acredita o se deduce de la puntuación de los participantes. Ayuda a formar sistemas de clasificación menos influenciados por los sesgos humanos, excepto, por supuesto, qué valores se utilizan para formar la clasificación. Esto no quiere decir que esté libre de todo sesgo. Desde el punto de vista matemático, el historial del participante siempre va a sesgar, al menos temporalmente, su clasificación. No puede tener en cuenta un accidente reciente que haya incapacitado al competidor para rendir al nivel anterior. Elo también fue muy útil antes de que Internet permitiera los emparejamientos entre oponentes distantes geográficamente.

Elo se popularizó como un sistema de clasificación de ajedrez para hacer frente a la dificultad de clasificar a los jugadores para las competiciones. De hecho, si alguna vez ha oído hablar de un maestro de ajedrez, gran parte de lo que determina su maestría es una puntuación alta basada en el Elo. A efectos competitivos, es deseable que los mejores ajedrecistas se enfrenten a oponentes con una clasificación similar. Además, a efectos de la clasificación, es deseable que los jugadores más hábiles no sean recompensados por golpear a los jugadores de menor categoría en un intento de aumentar su clasificación. Elo también está diseñado para hacer frente al reto de que muchos jugadores nunca se encuentren entre sí. En otras palabras, cuando la red de enfrentamientos es escasa. El aumento de la escasez sigue sesgando el sistema de clasificación. Sin embargo, las competiciones de mayor nivel reúnen a los mejores jugadores para nivelar este problema.

Elo y los sistemas de clasificación derivados de forma similar se utilizan en muchas plataformas de competición. Los videojuegos, los deportes y otras competiciones han adaptado el sistema de clasificación Elo a sus fines. De hecho, la aplicación del sistema de clasificación Elo al fútbol es más expresiva que su aplicación al ajedrez. En el ajedrez es más difícil cuantificar la fuerza de una victoria, ya que el recuento de piezas o los turnos pueden indicar el estilo frente a la fuerza. Mientras que, en el fútbol, el diferencial de puntos es un indicador relativamente bueno de la diferencia en la calidad de los equipos, especialmente en ligas ofensivas como la CFL.

¿Por qué usarlo?

Elo es, en muchos sentidos, una cuantificación de lo que los humanos hacen todo el tiempo con opiniones cualitativas sobre los equipos. Damos crédito a los equipos que ganan y reducimos nuestra opinión sobre los que pierden. Elo también es un juego de suma cero. Un equipo que gana gana la misma cantidad de crédito que cuesta el equipo que pierde. El Elo también puede modificarse de manera que los no favoritos obtengan más crédito por una victoria sobre un oponente favorecido y los favoritos ganen menos por vencer a oponentes no competitivos.

El Elo también es, en muchos sentidos, más expresivo que las columnas de victorias y derrotas por sí solas. Las columnas de victorias y derrotas son una reducción de la información en un bit singular de información. Si un equipo pierde, cero puntos, o si gana, un punto. En caso de empate, hay que ampliar la información para tener en cuenta los medios puntos. En comparación, Elo comienza con cada equipo con el mismo total de puntos inicial. Luego, en cada enfrentamiento, este total de puntos se incrementa, en caso de victoria, o se reduce en caso de derrota. La cantidad de este cambio comienza con un valor estándar que luego se incrementa en relación con el favoritismo del competidor para ganar/perder y por cuántos puntos ganó/perdió el competidor. En lugar de un valor único, el total de puntos ganados/perdidos expresa más información sobre el resultado de la competición.

¿Cuáles son los fundamentos?

Todos los equipos comienzan con una clasificación Elo de 1500. (Matemáticamente, este valor específico real de 1500 no importa de ninguna manera. Sin embargo, es agradable visualmente para tener uno lo suficientemente positivo como para que los equipos de bajo rendimiento no todos tienen valores negativos. Se podría empezar por cero, si se quisiera, o incluso por un millón. Sin embargo, en la práctica esto se evita.)

Además, daremos a cada juego un valor de K = 20. Por tanto, antes de cualquier otro factor, un equipo que gane ganará K puntos y el otro equipo perderá K puntos. Por ejemplo, si tenemos dos equipos equipo_{A} y equipo_{B} compitiendo con valoraciones de ELO^{before}_{team_{A}} = 1500 y ELO^{before}_{team_{B}} = 1500, entonces si equipo_{A} gana entonces ELO^{after}_{equipo_{A}} = 1520 y ELO^{after}_{equipo_{B}} = 1480. Si empatan, sus clasificaciones permanecerían sin cambios.

Si queremos limpiar esta fórmula, ELO^{after} = ELO^{before} + K * WL donde WL = 1 si el equipo ganó o WL = -1 si el equipo perdió.

¿Por qué elegir K = 20? En muchos sentidos K tiene más influencia que simplemente el valor para ajustar la clasificación de un equipo. Afecta a la capacidad de respuesta de un equipo a un evento de competición individual. Cuanto mayor sea el valor, mayor será la fluctuación. En el fútbol europeo, los diferentes niveles de eventos reciben diferentes valoraciones que intentan expresar la rareza de la competición y, con suerte, la seriedad con la que el país participante se toma el evento. Por ejemplo, los eventos de mayor calificación, como las finales de la Copa del Mundo, reciben un valor K=60, mientras que a los amistosos se les da K=20.

¿Esperanza de victoria?

La esperanza de victoria es una medida de cuáles son las probabilidades de que un equipo gane frente a otro. Más concretamente, el porcentaje de probabilidad de que un equipo gane. Por ejemplo, si el juego fuera lanzar una moneda, entonces cada equipo tendría 50\% de probabilidades. Un equipo favorecido tendrá un gran número que se aproxima a 100\% y un desvalido un valor que se aproxima a 0\%.

Utilizaremos un valor de esperanza de victoria para reemplazar $WL$ de la fórmula existente. En lugar de dar a un equipo todos los puntos indicados en K, lo ajustaremos en función de cómo se compare la esperanza de victoria de los equipos W_{e} con el resultado real de victorias y derrotas W. Un equipo que no tiene ninguna posibilidad de perder, aunque no se presentara tendría una expectativa de victoria de W_{e}=100\%=1, y un equipo que no tiene ninguna posibilidad de ganar tendría W_{e}=0\%=0. Un equipo que gana obtiene el valor completo de una victoria W=1, un equipo que pierde ningún valor W=0, y un equipo que empata la mitad del valor W=0.5.

Ahora determinamos la cantidad relativa de puntos que se da a cada parte en la competición en función de cómo terminó su resultado en relación a cómo se esperaba que terminara. Dos equipos pares tendrían un W_{e}= 0,5 y por tanto el ganador recibiría W - W_{e}= 1 - 0.5 = 1/2 de los puntos K y el perdedor obtendría W - 0,5 = -1/2 de K. Un equipo favorecido con un W_{e}= 0,75 que gane obtendría W - W_{e}= 1 - 0.75 = 1/4 de K, mientras que un underdog ganador con W_{e}= 0,25 obtendría W - W_{e}= 1- 0,25 = 3/4 de K. Un underdog que pierde a la inversa sólo pierde 1/4 de los puntos y un igualmente favorito pierde 3/4 de los puntos.
Si queremos limpiar esta fórmula:


ELO^{after} = ELO^{before} + K * (W - W_{e})
Para determinarW_{e}hay varios métodos. Uno de ellos es tomar una muestra de los resultados antes de aplicar la medida de la esperanza de ganar. Luego, hacer una tabla de referencia de la diferencia en las clasificaciones Elo y las probabilidades de que el equipo con mayor clasificación gane. A continuación, simplemente haga referencia a la tabla. A continuación, puede ajustar la tabla de forma iterativa basándose en las nuevas clasificaciones obtenidas al utilizar la esperanza de victoria hasta que los resultados se estabilicen. Otra alternativa, Hago uso de la fórmula aproximada

W_{e} = \frac{1}{10^{\frac{-diff}{400}+1}

donde el diferencial en los valores de Elo es

diff = ELO^{antes}_equipo_{A}} - ELO^{after}_{team_{B}}

¿Ventaja de campo?

Hasta ahora hemos ajustado para que un equipo sea considerado favorito. Sin embargo, intuitiva y estadísticamente sabemos que también hay una ventaja por jugar un partido en casa. Ya sea por los viajes, el sueño, las zonas horarias, los vestuarios u otras cuestiones. Para tener en cuenta esto, ajustamos el diferencial en 65 puntos para un equipo en casa y en la misma cantidad para un equipo en la carretera. Como resultado


diff_{HA} = \begin{cases} diff + 65, \text{if} location = Home\ diff - 65, \text{if} location = Away\\ diff, \text{otherwise}
y

W_{e} = \frac{1}{10^{\frac{-diff_{HA}}+1}

Para tener un poco de contexto, la regla general es que 65 puntos Elo valen aproximadamente 2,6 puntos anotados en un partido de la NFL. A partir de esto deberías ser capaz de extrapolar que cada 25 puntos Elo vale un solo punto en el juego. Por ejemplo, un diferencial en 250 puntos es una diferencia de puntos teórica de 10 puntos.

Este ajuste se extrae del Q/A de fivethirtyeight.com.

¿Qué queda? Margen de victoria

Todavía nos queda un último valor por contabilizar. Se trata de la cantidad de puntos por los que gana/perde un equipo, también conocido como margen de victoria. A menudo, cuando un favorito gana, el diferencial de puntos se va de las manos por más razones que el diferencial competitivo de los equipos. Piensa en un equipo de una conferencia poderosa de fútbol universitario contra un equipo de una conferencia apenas media. Lo que queremos hacer es utilizar un multiplicador mult para ajustar K al resultado del partido.

Este multiplicador tendrá dos partes. La primera aplicará rendimientos decrecientes sobre el total de puntos a medida que el diferencial de puntuación sea mayor. Una función matemática muy adecuada es el logaritmo natural ln. El segundo es un multiplicador que disminuye cuando el Eloof del ganador es mayor que el del perdedor y aumenta cuando el Eloof del perdedor es mayor que el del ganador.

Para la primera parte tenemos la fórmula

ln(|left|pts_{W}-pts_{L}\right|+1)

Un partido empatado sería entonces ln(1) = 0 lo que resulta en ningún multiplicador. Una diferencia de un gol de campo es ln(3+1) y una diferencia de un touchdown es ln(7+1). Obsérvese, podemos ver los rendimientos decrecientes para el diferencial de puntos ganados por ln(8) = ~2.08ln(15) = ~2,71ln(22) = ~3,09, y ln(29) = ~3.37.

Para el segundo, partimos de un multiplicador de 2,2 y lo ajustamos en función del diferencial Elo del equipo diff antes del ajuste en casa y fuera. El resultado es frac{2.2}{2.2+\frac{diff}{1000}. Este multiplicador comienza en 1 y disminuye a medida que los valores Elo del competidor se alejan.

El multiplicador acumulado es


mult = (ln(\left|pts_{W}-pts_{L}\right|+1) * (\frac{2.2}{2.2+\frac{diff}{1000})
Este multiplicador está sacado del Q/A de fivethirtyeight.com.

Ejemplo neutral

Suena a muchas matemáticas.

Aquí hay un ejemplo neutral de dos equipos medios en un sitio neutral. Con un equipo que gana por un solo touchdown.

Tendremos dos equipos, un ganador equipo_{W} y un perdedor equipo_{L}.

Ambos equipos comienzan con un ELO medio ELO^{antes}_{equipo_{W}}=1500 y ELO^{antes}_{equipo_{L}}=1500.

Como resultado tenemos un diferencial de diff =ELO^{before}_{team_{W}} - ELO^{after}_{team_{L}} = 1500-1500 = 0.

Un partido en campo neutral significa diff = diff_{HA} = 0.

La esperanza de victoria resultante W_{e} = \frac{1}{10^{frac{0}{400}}+1} = \frac{1}{10^{0}+1} = \frac{1}{1+1} = 0.5.

El equipo ganador obtendrá entonces W - W_{e} = 1 - 0.5 = 1/2 de K y el equipo perdedor obtendrá W - W_{e} = 0 - 0,5 = -1/2 de K.

El valor de K en sí mismo es


\begin{array}{rl} K * mult = & 20 * (ln(\left|pts_{W}-pts_{L}\right|+1) * (\frac{2.2}{2.2+\frac{diff}{1000}}) \\ = & 20 * (ln(\left|7\right|+1) * (\frac{2.2}{2.2}) = 20 * ln(8) \\ = & ~41.59. \end{array}
El ganador, por tanto, tendrá
ELO^{después}_equipo_{W}} = ELO^{antes}_equipo_{W}} + 0,5 * 41,59 = 1500+\frac{41,59}{2}
mientras que el perdedor tendrá
ELO^{después}_equipo_{L}} = ELO^{antes}_equipo_{L}} + (-0,5) * 41,59 = 1500-\frac{41,59}{2}.

Nueva Temporada

Para tener en cuenta la rotación de personal de la temporada baja, el Elo de un equipo sufre una regresión hacia el valor medio de 1500 en un tercio.


ELO^{{start}_{curr}= (ELO^{end}_{last}-1500)*\frac{2}{3}+1500

Valores CFL Elo significativos

Nombre Elo
Top 0.1% All-Time 1750
Top 1% All-Time 1700 Top 5% All-Time 1650 Promedio de equipos de la Grey Cup 1600 Promedio de equipos de la Conference Finals 1575 Promedio de equipos de la Conference Semi-Finales de Conferencia 1525

Dejar una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *