Anda di halaman 1dari 20

Descripción de los jugadores en el juego Fifa19®

Juan Felipe Osorio Ramírez


Brian Nicolas Granados
Juan Sebastián Cortés Sánchez

Este trabajo es presentado al profesor


PhD. Campo Elías Pardo

Departmento de Estadística
Universidad Nacional de Colombia
Bogotá, Colombia
Julio de 2019
Índice
1. Introducción 2

2. Objetivos 3

3. Descripción de los datos 3

4. Metodología 8

5. Análisis de resultados 8
5.1. ACM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

1
1. Introducción
El fútbol es un deporte que desempeña un papel de relevancia social y empresarial en el
contexto global (Garcı ́a del Barrio y Pujol, 2008). Su historia es robusta y extensa con refe-
rencias que datan su origen al siglo III y II a.C. con variantes que van desde el aspecto militar
hasta el ceremorial y hoy en día, el económico, emocional y de entretenimiento (Mirallas,
2004).
En dicho deporte, que cuenta con aproximadamente 4 billones de fanáticos en todo el mundo
(Boudway, 2018), y que genera diversos tipos de datos que varían desde conteos durante
partidos de diversa índole hasta características de jugadores que le permiten a los equipos
detectar sus falencias, aprender de ellas y crear estrategias de mejora continua, es útil analizar
la información generada para crear conceptos mucho más fundamentados y con una base lo
suficientemente fuerte. Por mencionar un ejemplo de lo anterior, el Liverpool, equipo de la
primera división de la Premier League desde el 2015, hizo énfasis en analizar el rendimiento de
sus jugadores y técnicos para próximas contrataciones. Además, el director de investigación
para el análisis de datos Ian Graham, del club inglés, afirma haber construido una base de
más de 100.000 jugadores alrededor del mundo para que el club logre ahorrar dinero con sus
próximas decisiones y tener mayores chances de ganar (Schoenfeld, 2019).
Paralelamente a lo previamente expuesto, se ha vivido una gran revolución por medio
de la simulación en los videojuegos ya que, cada año, estos se hacen más asertivos con las
características que toman de cada jugador y a parte de ser un negocio masivo, resultan ser
un buen medidor para posibles contrataciones en los equipos. Además, jugar video juegos
como Fifa19 puede ayudar a los jugadores a captar las complejidades del deporte a una edad
temprana (Shields, 2018).

En esencia, este trabajo estará desarrollado y soportado sobre la base de datos del juego
arcade de fútbol Fifa19 el cuál fue creado por la empresa Electronic Arts(EA) que fue fundada
en 1982 y tiene su sede principal en California, Estados Unidos. Ésta misma es líder mundial
en entretenimiento digital interactivo.
EA desarrolla y ofrece juegos, contenido y servicios en línea para consolas conectadas a
Internet, dispositivos móviles y computadoras personales.Dicha empresa Tiene más de 300
millones de jugadores registrados en todo el mundo y además, en el año fiscal 2018, reportó
unos ingresos netos de aproximadamente 5 billones de dólares (Electronic, 2019).

Ahora, si hablamos en detalle de los datos del juego y su parecido con la realidad, se
puede decir que expertos como Michael Mueller-Moehring quién trabaja tanto para la Fifa
como para Electronic Arts y quién dirige el proceso de recolección de datos con un equipo
de 9000 personas quienes le dan forma a los atributos de cada jugador en Fifa19 (Arroyo,
2018).
En este trabajo, por medio de métodos de la estadística descriptiva multivariada se quie-
ren explorar tanto las diversas relaciones entre las variables como los patrones y/o grupos
que puedan surgir entre ellos para así cumlpir con los diversos objetivos que se plantean a
continuación.

2
2. Objetivos
Explorar las características físicas, mentales y técnicas debe tener un jugador para que
su salario sea mayor a 50 mil dólares.

Encontrar las características de juego que describen mejor a un delantero, un defensa,


un mediocampista y un arquero.

Determinar las posibles asociaciones entre las variables sociodemográficas como lo son
la edad, el sueldo, la región de origen y la identidad profesional de cada jugador dada
por la posición en el campo de juego.

Determinar si existe relación entre la región de origen del un jugador y la posición en la


que juega.

3. Descripción de los datos


En la página de EA Sports se publican los atributos de los jugadores en el juego1 y se
cuenta inicialmente una tabla que tiene 18.207 jugadores (filas) y 88 variables (columnas)
que describen sus características físicas, técnicas, mentales y sociodemográficas.
Para empezar se retiran las siguientes variables ya que no aportaran a cumplir con los obje-
tivos de este trabajo: ID, Photo, Flag, Overall, Potential, Club Logo, Value, Special, International
Reputation, Weak Foot,Jersey Number, Skill Moves, Work Rate, Body Type, Real Face, Joined, Loa-
ned From, Contract Valid Until, LS, ST, RS, LW, LF, CF, RF, RW, LAM, CAM, RAM, LM, LCM,
CM, RCM, RM, LWB, LDM, CDM, RDM, RWB, LB, LCB, LM, LCM, CM, RCM, CB, RCB, RB y
Release Clause. Además, se recodifican algunas variables tales como Age, Country, Height, Weight y
Wage.
Luego de este proceso de limpieza de los datos, se obtiene una tabla que llamaremos df, la cuál con-
tiene 42 variables y 16280 jugadores.
En el cuadro 1, se encuentra la descripción de cada una de las variables categóricas. Para la región de
origen del jugador se destaca que la mayoría de jugadores son europeos(57,2 %) seguido de surameri-
canos (19,4 %). Además el 76,3 % de los jugadores tienen como derecho su pie dominante, y respecto
al salario, un 44,1 % devengan un salario de 1.000 USD a 2.000 USD, pero tan solo un 3,2 % más
de 50.000 USD. Finalmente, se tiene que un 33 % de los jugadores juegan en posiciones de ataque
(ATQ), 23 % de defensa (DEF), 15 % mediocampistas (MED) y 7 % como arquero (ARQ).

En el cuadro 2 tenemos la lista de variables cuantitativas las cuales se miden en una escala de 0 a
100, exceptuando la altura del jugador(Height) y su peso(Weight) las cuales se miden en centímetros
y kilogramos.
Algunas descripciones de las variables cuantitativas se exponen en las figuras 2 y 3, que corres-
ponden a los histogramas de variables cuantitativas exclusivas del arqueroy técnicas respectivamente.
De la figura 2 se destaca que en general los jugadores se dividen entre los que son arqueros y los que
no, y es por esto que se evidencian distribuciones empírica bimodales.
Es importante aclarar el origen de esta base de datos ya que un equipo de 9000 personas, llamadas
data reviewers conformado por ojeadores profesionales, abonados de temporada de los distintos clubes,
entrenadores de menor nivel, entre otros. Estas personas se encargan de contextualizar las estadísticas
que recibe la compañia. Una vez se tienen los datos y se han aportado las aclaraciones correspondientes,
son 300 editores los que dividen toda la información en 300 campos diferentes y lo reparten en 35
categorías de atributos específicas. Este largo proceso esta bajo la supervisión de Michael Mueller-
Moehring, quien no solo trabaja para EA Sports, sino también para la propia FIFA bajo el cargo de
1
Los datos también se encuentran disponibles en el siguiente link: https://www.kaggle.com/karangadiya/fifa19

3
Figura 1: Tortas mostrando la distribución de las categorías de las variables cualitativas Edad,
Region, Salario y Pie Dominante de los jugadores.

Figura 2: Histogramas de las habilidades de los arqueros. Se entiende la inicial GK como Goal
Keeper del inglés.

4
Figura 3: Histogramas de las variables técnicas de juego de los jugadores.

5
Variable Descripción
Name Nombre del jugador.
Agee Edad del jugador que puede ser:
16a21, 21a25, 25a28 y 28a45 .
Country País de origen del jugador.
Region Región de origen del jugador que pue-
de ser: SouthAmerica, NCAmerica,Asia,
Africa, Oceania y Europe.
Club Club de fútbol al que pertenece el ju-
gador.
Wagee Salario del jugador en miles
de dólares, que puede ser:1a2,
3a5,6a15,15a50 y 50+.
Preferred Foot Pie dominante del jugador, que puede
ser: Left y Right.
Position Posición en la que generalmente se
desempeña el jugador, que puede ser:
ATQ , MED, DEF y ARQ

Cuadro 1: Descripción de las variables categóricas en df.

”Head of Data Collection & Licensing es así es como se recopila esta gran cantidad de información
2

(Arroyo, 2018).

6
Variable Descripción
Height Altura del jugador en cm.
Weight Peso del jugador en kg.
Crossing Aptitud para cambiar de .
Finishing Capacidad de remate.
HeadingAccuracy Precisión al cabecear.
ShortPassing Habilidad para hacer pases cortos.
Volleys Capacidad para hacer voleas.
Dribbling Capacidad para llevar el balón y pasar
a un oponente.
Curve Habilidad para curvar el balón cuando
hace un pase o le pega al balón.
FKAccuracy Capacidad para cobrar tiros libres.
LongPassing Habilidad para hacer pases largos.
BallControl Control de balón.
Acceleration Aceleración del jugador.
SprintSpeed Velocidad de sprint del jugador.
Agility Agilidad del jugador.
Reactions Velocidad para actuar y reacción del
jugador.
ShotPower Potencia de los remates del jugador.
Jumping Capacidad de salto del jugador.
Stamina Capacidad para mantener un esfuer-
zo físico o mental prolongado en un
partido.
Strength Fuerza física del jugador.
LongShots Precisión del jugador para los tiros
desde largas distancias.
Aggression Nivel de agresividad.
Interceptions Capacidad para interceptar el balón.
Positioning Nivel de posicionamiento.
Vision Nivel de visión.
Penalties La precisión del jugador para cobrar
tiros penales.
Composure Sensación de estar tranquilo y con-
trolar su frustración.
Marking Capacidad del jugador para marcar al
jugador oponente.
StandingTackle Entrada de defensa.
SlidingTackle Barrida de defensa.
GKDiving Capacidad para atajar.
GKHandling Manejo de balon con las manos del
portero.
GKKicking Saque del portero.
GKPositioning Posicionamiento del portero.
GKReflexes Reflejos del portero.

Cuadro 2: Descripción de las variables cuantitativas en df.

7
4. Metodología
Para desarrollar el primer objetivo se realizará un análisis de componentes principales (ACP) to-
mando como variables activas el conjunto de 35 variables físicas, mentales y técnicas de los jugadores.
Luego de entender las relaciones encontradas en los planos factoriales tanto de los individuos como
de las variables proyectará como ilustrativa la variable Salario(Wage).

Falta metodología de los demás objetivos.

Finalmente, para determinar si existe relación entre el país de origen y la posición del jugador
realizamos un análisis de correspondencias simples. Además se realizara un análisis de correspondencias
múltiples para descubrir posibles patrones que subdividan a los jugadores en grupos y describir las
posibles asociaciones entre las variables cualitativas.

5. Análisis de resultados

Figura 4: Primer plano factorial del ACP de las variables cuantitativas de los jugadores.

8
Figura 5: Primer plano factorial del ACP de las variables cuantitativas de los jugadores donde
se proyecta como ilustrativa la variable Salario.

Figura 6: Círculo de correlaciones de las variables cuantitativas.

9
Figura 7: Distribución de las posiciones según las regiones

Figura 8: Distribución de las regiones segun las posiciones a las que pertenecen los jugadores
nacionalizados en dicho lugar

10
Figura 9: ACS en el primer plano factorial

Figura 10: ACS en el plano factorial 2-3

11
Figura 11: ACS en el plano factorial 1-3

Figura 12: ACS en el primer plano factorial con ucal=0.92

12
Posición Salario V.test Class/Cat Cat/Class Global ncat
ARQ [1,2] 13.08 57.80 15.60 11.90 1989
MED [1,2] -3.93 42.20 34.20 35.80 5978
ATQ [1,2] -4.88 40.20 16.20 17.80 2972
DEF [3,5] 2.14 22.60 35.80 34.50 5771
ARQ [3,5] -6.17 16.60 9.10 11.90 1989
ARQ [6,15] -3.73 14.90 10.00 11.90 1989
ATQ [15,50) 2.91 14.70 19.90 17.80 2972
MED [15,50) 2.31 13.90 37.70 35.80 5978
ARQ [15,50) -6.83 8.50 7.70 11.90 1989
ATQ [50,infty) 2.63 4.00 21.80 17.80 2972
ARQ [50,infty) -3.30 2.10 7.80 11.90 1989

Posición Salario V.test Class/Cat Cat/Class Global ncat


ARQ [1,2] 13.08 57.80 15.60 11.90 1989
MED [1,2] -3.93 42.20 34.20 35.80 5978
ATQ [1,2] -4.88 40.20 16.20 17.80 2972
DEF [3,5] 2.14 22.60 35.80 34.50 5771
ARQ [3,5] -6.17 16.60 9.10 11.90 1989
ARQ [6,15] -3.73 14.90 10.00 11.90 1989
ATQ [15,50) 2.91 14.70 19.90 17.80 2972
MED [15,50) 2.31 13.90 37.70 35.80 5978
ARQ [15,50) -6.83 8.50 7.70 11.90 1989
ATQ [50,infty) 2.63 4.00 21.80 17.80 2972
ARQ [50,infty) -3.30 2.10 7.80 11.90 1989

13
Variable EJE1 EJE2 EJE3
Height -0.11 0.19 0.27
Weight -0.09 0.18 0.34
Crossing 0.20 -0.05 0.00
Finishing 0.18 -0.20 0.11
HeadingAccuracy 0.17 0.19 0.04
ShortPassing 0.21 0.03 0.07
Volleys 0.19 -0.16 0.14
Dribbling 0.21 -0.10 -0.00
Curve 0.20 -0.11 0.09
FKAccuracy 0.18 -0.09 0.12
LongPassing 0.19 0.06 0.09
BallControl 0.22 -0.03 0.04
Acceleration 0.17 -0.13 -0.16
SprintSpeed 0.17 -0.11 -0.14
Agility 0.17 -0.17 -0.09
Reactions 0.09 0.04 0.40
ShotPower 0.20 -0.07 0.15
Jumping 0.06 0.12 0.06
Stamina 0.19 0.10 -0.02
Strength 0.02 0.27 0.30
LongShots 0.20 -0.13 0.14
Aggression 0.15 0.26 0.07
Interceptions 0.12 0.34 -0.02
Positioning 0.20 -0.14 0.06
Vision 0.16 -0.15 0.21
Penalties 0.18 -0.13 0.10
Composure 0.15 0.03 0.31
Marking 0.13 0.32 -0.06
StandingTackle 0.12 0.34 -0.07
SlidingTackle 0.11 0.34 -0.09
GKDiving -0.20 -0.07 0.21
GKHandling -0.20 -0.07 0.21
GKKicking -0.20 -0.07 0.21
GKPositioning -0.20 -0.07 0.21
GKReflexes -0.20 -0.07 0.21

14
5.1. ACM

Figura 13: Diagrama de valores propios

Figura 14: Diagrama Criterio Benzecri

15
Figura 15: Primer plano factorial del ACM de las variables cualitativas de los jugadores.

Figura 16: Segundo plano factorial del ACM de las variables cualitativas de los jugadores.

16
Figura 17: Histograma nodos.

17
Figura 18: Proyeccion de las clases sobre el primer plano factorial de las variables cualtitaivas.

Cuadro 3: Inercia de los grupos construidos


Bef.Size Aft.Size Bef.Inertia Aft.Inertia Bef.Weight Aft.Weight Bef.Dist_2 Aft.Dist_2
1 2751 2016 0.088 0.046 0.16 0.12 0.16 0.14
2 2880 2952 0.080 0.078 0.17 0.18 0.35 0.37
3 1947 1784 0.074 0.062 0.12 0.11 0.85 1.14
4 2682 2880 0.060 0.063 0.16 0.17 0.56 0.37
5 918 1038 0.035 0.036 0.05 0.06 1.45 1.42
6 1676 1812 0.053 0.060 0.10 0.11 0.95 1.15
7 1439 1503 0.046 0.045 0.09 0.09 0.90 1.05
8 1401 1568 0.056 0.055 0.08 0.09 1.17 1.02
9 1016 1157 0.017 0.023 0.06 0.07 0.58 0.60
TOTAL 16710 16710 0.509 0.471 1.00 1.00

18
Referencias
Arroyo, David (2018). “FIFA 19: ¿Quién elige la puntuación de los jugadores?” En: MeriS-
tation. URL: https://as.com/meristation/2018/07/24/noticias/1532411743_
313242.html (visitado 15-06-2019).
Boudway, Ira (2018). “Soccer Is the World’s Most Popular Sport and Still Growing”. En:
Bloomberg. URL: https : / / www . bloomberg . com / news / articles / 2018 - 06 - 12 /
soccer - is - the - world - s - most - popular - sport - and - still - growing (visitado
15-06-2019).
Electronic, Arts (2019). “About Electronic Arts”. En: Official Site of Electronic Arts. URL:
https://www.ea.com/about (visitado 15-06-2019).
Garcı ́a del Barrio, Pedro y Francesc Pujol (2008). “El papel del fútbol en la sociedad actual,
Fútbol: ocio y negocio”. En: Revista empresa y humanismo 11.1, págs. 89-108.
Mirallas, JA (2004). “Antecendetes históricos”. En: F. Drobnic, JM González de Suso y JL
Martı ́nez (Eds), Fútbol, bases cientı ́ficas para un óptimo rendimiento, págs. 3-11.
Schoenfeld, Bruce (2019). “How Data (and Some Breathtaking Soccer) Brought Liverpool to
the Cusp of Glory”. En: The New York Times Maganize. URL: https://www.nytimes.
com/2019/05/22/magazine/soccer-data-liverpool.html (visitado 22-05-2019).
Shields, Graig (2018). “Will playing Fifa create a new generation of smarter footballers?” En:
The Guardian. URL: https://www.theguardian.com/football/2018/feb/10/fifa-
playstation-training-football-youth-coaching (visitado 15-06-2019).

19

Anda mungkin juga menyukai