Análisis de Regresión: El Valor De Un Gol Mundialista

By | May 1, 2016

Recientemente, el sitio web oficial de Major League Soccer (MLS) publico un articulo que discute la relación entre los Portland Timbers, los campeones actual de la Copa MLS, y un estudiante de Harvard que usa estadísticas para analizar jugadores en quien el club tiene interés. Los Timbers no mencionaron muchos detalles sobre que exactamente hace el escolar de 20 años de edad, pero claramente piensan muy bien de él y sus contribuciones al club; los Timbers están mandándole unos de los anillos de campeonato que ganaron durante su primer temporada de estar trabajando con él.

Bueno, a mi me encanta el fútbol y, como un estudiante de ciencias de la computación con un interés en la ciencia de datos, esto suena como un trabajo soñado. Desafortunadamente, no ha tenido mucha experiencia trabajando con datos del fútbol durante mi carera académica, pero si ha tenido alguna experiencia. El año pasado, en mi primer semestre en Duke, utilice el poco conocimiento estadístico que tenia al tiempo para hacer un proyecto donde analicé el valor de un gol en una Copa Mundial, usando datos de el último mundial en 2014. En mi intento de subirme al carro de la analítica y tal vez llamar la atención de alguien importante con la maravillas de regresión lineal (prometo que he aprendido mas desde que hice esto), presento: “Encontrando el Valor de un Gol Mundialista.”

Espero que algunos equipos de la MLS todavía estén buscando a estudiantes de segundo año en la universidad para contratar!

Para abordar la cuestión plateada, primero creé una lista de todos los jugadores que terminaron una transferencia a otro club después de jugar en la Copa Mundial 2014. Entre esos jugadores, noté cuantos goles y asistencia para un gol hicieron en la Copa Mundial 2014. Incluí asistencias porque pienso que, para un club buscando un jugador atacante, la habilidad de crear una oportunidad buena para un gol es tan importante como marcar ese gol. También agregué los costes de las transferencias (incluyendo jugadores que fueron transferencias gratis, como David Villa). Otro variable que incluí fue si fueron jugadores defensivos (codificado como 0 o 1).

Usando estos variables—edad, defensa o no, y goles + asistencias—creé una regresión lineal en R para tratar de explicar la variación en los costes de transferencia después del mundial. El modelo inicial, aunque dijo que el parámetro de goles creados si corresponda significativamente con el aumento de cuota de transferencia (p-value < 0.05), no pasó todos los supuestos de un modelo robusto y fiable. Es decir, los residuos no fueron casi normales y la variancia no fue constante. Después de un análisis de los valores atípicos, se encontró varios jugadores que estaban sesgando los datos. Usando la medida de Distancia de Cook (que calcula estima la influencia de un punto de información en una regresión), se removió unos puntos. Dos de esos puntos fueron las transferencias muy publicas de Luis Suarez y Ángel Di María.  Luis Suarez solamente marco 2 goles en el Mundial, pero cuando se considera que fue suspendido después de jugar 2 partidos, su cuenta se parece mas impresionante que el modelo puede saber, y su cuota de 81 millones de euros hace mas sentido. Además, el modelo no puso en cuenta que tan famosos y exitosos los jugadores eran antes del Mundial en la temporada anterior, como en el caso de Suarez y en el de Ángel Di María. Aunque Di María tuvo un Mundial “malo” por sus normas (2 goles + asistencias), todavía fue un jugador muy famosos y respetado, y se espera que un Mundial afecta a su reputación menos que otros jugadores menos sabidos.

Con estos factores controlados, el nuevo modelo si se puede decir que es relativamente robusto y fiable (especialmente comparado con el otro), y todavía reporta que el parámetro de goles creados si corresponda significativamente con el aumento de cuota de transferencia. Específicamente, cada gol o asistencia marcado en un Mundial por un jugador que no es defensivo, es asociado con un aumento de 8.79 millones de euros a la cuesta de transferencia de un jugador que se transfiere directamente después de una Copa Mundial. El modelo tiene un R2 ajustada de 0.68, significando que aproximadamente 68% de la variación entre los cuotas de transferencia es explicado por este modelo.

 

Screen Shot 2016-05-01 at 3.09.57 AM

R demuestra que goles + asistencias es significativamente associado con el aumento del cuota de transferencia de un jugador

 

El proyecto, obviamente, no es perfecto. Si fuera a rehacer este estudio, probablemente incluyera mas variables fuera del contexto del Mundial que mejor encaja lo que afecta cuesto de una transferencia y el valor de un jugador. Datos como edad del jugador, o el numero de goles que marco en la temporada anterior ayudarían en mitigar los valores atípicos y controlar para mas factores externos. Para ahora, el valor de un gol mundialista es cerca de 9 millones de euros, que es una suma bastante grande. Demuestra un poco de un parcialidad de clubs para jugadores que son mas famosos, ya sea para vender mas camisetas o porque piensan que son mejores. Definitivamente enfatiza la importancia global de la Copa Mundial como un espectáculo y como el evento cultural mas grande que existe. Un gol mundialista puede cambiarle la vida a cualquier jugador.

Bibliografía/Donde coge mis datos 

  1. “Why the Portland Timbers Hired a Harvard Sophomore to Help Them Reload.” MLSsoccer.com. N.p., 13 Apr. 2016. Web. 01 May 2016. <http://www.mlssoccer.com/post/2016/04/13/why-portland-timbers-hired-harvard-sophomore-help-them-reload>.
  2. “2014 FIFA World Cup Brazil™ – FIFA.com.” FIFA.com. N.p., n.d. Web. 01 May 2016. <http://www.fifa.com/worldcup/archive/brazil2014/>.
  3. “European Leagues and Cup Competitions.” Transfermarkt. Transfermarkt, n.d. Web. 01 May 2016. <http://www.transfermarkt.com/>.
Category: Uncategorized

About Nayib Gloria

I’m Nayib. I grew up in Miami, Florida, and my family is from Barranquilla, Colombia. A fan of FC Barcelona, but a fan of fútbol first and foremost. I like underdog stories and bad, forced puns.

Leave a Reply

Your email address will not be published. Required fields are marked *