Validación de un instrumento para calificar la competencia futbolística a partir de Wyscout

Rubén Sánchez-López

Ibon Echeazarra

Julen Castellano

*Correspondencia: R. Sánchez-López rsanchez051@ikasle.ehu.eus

Idioma del original Español

Citación

Sánchez-López, R., Echeazarra, I. & Castellano, J. (2023). Validation of an instrument to qualify Football Competence in professional players via WyScout data provider.  Apunts Educación Física y Deportes, 154, 83-94. https://doi.org/10.5672/apunts.2014-0983.es.(2023/4).154.08

3203Visitas

Resumen

El objetivo de este trabajo fue diseñar y validar un instrumento (TOPSTATS) que permitiese calificar, clasificar y comparar el rendimiento de los jugadores profesionales a partir del proveedor de datos Wyscout. La validez de contenido a través de la consulta con tres expertos mostró un acuerdo considerable haciendo uso del índice kappa de Fleiss (k = .691). Extrayendo los datos de las actuaciones de los jugadores de la temporada 2019-2020 en La Liga española y la Premier League inglesa, se procedió a calcular la validez de criterio relacionando las puntuaciones totales de los jugadores obtenidas en TOPSTATS con las de Sofascore. La correlación de Pearson evidenció una asociación significativa en todas las posiciones de juego (r = 0.3-0.88, p < .05). Se utilizó el mismo procedimiento para garantizar la validez de constructo, relacionando las puntuaciones totales de los jugadores con su valor de mercado. En este caso, la correlación de Pearson mostró una asociación significativa en 17 de las 24 posiciones de juego (r = 0.36-0.80; p < .05). Se concluye que TOPSTATS mostró unos valores óptimos de validez. Es un instrumento capaz de comparar la competencia futbolística que muestran los jugadores en sus actuaciones durante una misma competición, de acuerdo con su posición de juego. Para ello, la herramienta permite calcular, de una forma ágil y semiautomática, un índice de rendimiento global obtenido a partir de la interacción y ponderación de variables que contienen datos proporcionados desde Wyscout, que, siendo una plataforma de suscripción, cuenta con cobertura en más de 200 competiciones.

Palabras clave: análisis de datos, evaluación, fútbol, La Liga, Premier League, rendimiento deportivo.

Introducción 

El análisis de datos deportivos ha despertado interés desde hace mucho tiempo (Anderson y Sally, 2014; Bornn et al., 2018), pero no ha sido hasta estos últimos años cuando se han desarrollado estadísticas de fútbol, gracias a tecnologías que proporcionan grandes flujos de datos de alta fiabilidad extraídos en cada partido (Pappalardo et al., 2019b). Desafortunadamente, la utilización y manipulación de estos datos no es una tarea fácil si se pretende valorar la competencia futbolística (Parlebas, 2018) que muestran los jugadores durante sus actuaciones, ya que no existe una métrica consolidada y ampliamente aceptada para medir la calidad del rendimiento en todas sus facetas (Pappalardo et al., 2019a). Esto es debido a que el fútbol es un deporte de máxima complejidad, que exige un abordaje multidimensional, ya que las respuestas motrices de los jugadores son dinámicas y no lineales (Garganta y Gréhaigne, 1999; Gréhaigne et al., 1997; Ric et al., 2016). 

Las respuestas motrices de los jugadores toman forma a partir de las conductas que despliegan de acuerdo con su rol sociomotor. El rol de cada jugador es un estatus sociomotor concreto (Parlebas, 2001), que va cambiando durante el juego. Cada jugador desarrolla sus conductas en base a la orientación particular que hace de su rol (Lasierra, 1993). Es decir, a partir de las acciones propias de los subroles sociomotores, que dan lugar a cada una de las posibles conductas que el jugador puede desarrollar durante el juego (Hernández Moreno, 1995), siendo toda conducta una modalidad particular del concepto genérico “acción motora” (Parlebas, 2023). La eficacia en las conductas que despliega cada jugador durante su actuación en un evento determinado o conjunto de eventos determina su rendimiento o performance. Mientras que la performance es algo concreto y temporal, la competencia es un concepto global que viene a responder sobre el rendimiento duradero y estable en el tiempo producto del aprendizaje.

Fundamentalmente, los proveedores aportan dos tipos de datos: “tracking” y “eventing”. El tracking ofrece datos sobre la posición exacta del jugador en el campo (Otero-Saborido et al., 2021), permitiendo evaluar comportamientos emergentes a través de las tendencias de posición y movimientos del jugador producto de la interacción con compañeros y adversarios. A partir de estos datos de posición, desde el ámbito científico han visto la luz trabajos orientados al fútbol formativo (Coutinho et al., 2022; Errekagorri et al., 2020), y al fútbol de élite (Castellano y Echeazarra, 2019). El eventing consiste en el registro y etiquetado de las acciones que desempeña el jugador, así como su eficacia, normalmente en relación con el balón (Otero-Saborido et al., 2021). Haciendo uso del proveedor Wyscout, se pueden encontrar varios trabajos recientemente publicados (Díez et al., 2021; Izzo et al., 2020; Zeng y Pan, 2021).

Dentro de las plataformas de eventing que ofrecen los proveedores de datos se puede comparar el rendimiento de los jugadores con respecto a una variable. También es posible usar gráficos de dispersión para comparar variables por pares, o incluso aglutinar varias métricas en un gráfico, que normalmente es presentado en forma de radar. Sin embargo, ninguna de estas opciones suele permitir responder a preguntas del tipo: ¿qué jugador está rindiendo mejor en la liga?, ¿qué jugador debería ser fichado?, siendo la selección de jugadores un factor clave en el rendimiento de cualquier competición (Partovi y Corredoira, 2002). Es decir, si un delantero marca muchos goles, quizás su rendimiento global se pueda considerar alto, porque el gol es una variable muy determinante, pero no es el único factor que considerar. De igual modo, si un extremo tiene una gran eficacia regateando, o un central interceptando, no se puede aventurar que su rendimiento global sea alto, ya que el rendimiento en fútbol, como ha sido apuntado, es un constructo multifactorial. En este sentido, sí que es cierto que en una posición de juego hay acciones que son más importantes que otras, porque se dan en mayor medida o porque son especialmente relevantes. 

Actualmente, se recopilan grandes cantidades de datos, aunque en muchos casos se desconoce la validez de las métricas, es decir, como están vinculadas al éxito o si permiten definir diferentes niveles de rendimiento (Castellano y Clemente, 2020). Es cierto que estamos asistiendo a un cambio progresivo de las métricas clásicas ofrecidas por los proveedores a métricas de carácter más avanzado y contextualizado. De este modo, las acciones de juego, tradicionalmente registradas a partir de la relación del jugador con el balón, progresivamente van siendo entendidas como el resultado de la interacción funcional entre el jugador y su entorno con un determinado propósito (Araújo, 2005). A través de bases de datos lo suficientemente amplias, en donde hayan sido registradas las acciones en torno a diferentes variables, los analistas pueden obtener clasificaciones y calificaciones generales de los jugadores a través de la evaluación de todas estas acciones  (Berrar et al., 2019). Por eso, es importante evaluar la validez de las clasificaciones e índices de rendimiento de manera cuantitativa y exhaustiva, a través de conjuntos de datos creados con la ayuda de expertos (Pappalardo et al., 2019a). 

En definitiva, apuntada la necesidad de calcular un indicador global del rendimiento, producto del volumen y eficacia de las acciones más representativas que van desplegando los jugadores de acuerdo con su posición de juego, el objetivo de este trabajo fue diseñar y validar un instrumento que permitiese calificar, clasificar y comparar el rendimiento de los jugadores profesionales, entendido como la competencia futbolística que muestran en sus actuaciones, a partir del proveedor de datos Wyscout.

Método

Diseño

El presente trabajo respondió a un estudio instrumental (León y Montero, 2007), destinado al diseño y la validación de una herramienta de calificación, clasificación y comparación de la competencia futbolística en jugadores de fútbol profesional. Cabe reseñar que este estudio no abordó el proceso de obtención de evidencias de fiabilidad sobre los datos extraídos desde la plataforma de Wyscout, ya que para confirmar la fiabilidad de estos se recurrió a los resultados encontrados en un estudio previo (Pappalardo et al., 2019a), que replicó el protocolo realizado para asegurar la fiabilidad de los datos de Opta (Liu et al., 2013).

Participantes 

Para el diseño y la validación del instrumento TOPSTATS se contó con la colaboración de dos expertos en fútbol que, junto al investigador, aportaron sus conocimientos en cuatro sesiones de consulta y discusión. Los dos expertos en fútbol contaban con más de 10 años de experiencia en el análisis de la Primera División española y la Premier League inglesa, respectivamente. 

Diseño del Instrumento   

El instrumento TOPSTATS fue diseñado en el software Excel 2013, tomando en consideración las 111 variables que proporcionaba el proveedor Wyscout en el momento de validación de la herramienta. Originalmente, consta de un conjunto de archivos de Excel diseñados ad hoc que representan por separado aquellas posiciones de juego que, bajo el juicio de los expertos que intervinieron en el proceso de validación del instrumento, se pueden encontrar en los equipos de forma más habitual. Estas son nueve: portero, defensa central, defensa lateral (derecho e izquierdo), medio centro defensivo, medio box-to-box, medio creativo, medio de banda (derecho e izquierdo), extremo (derecho e izquierdo) y delantero. En cada posición se analiza el rendimiento general de los jugadores que actúan en dicha posición, de acuerdo con la interacción de las 12 variables más representativas, según el juicio de los expertos.

Validación del Instrumento

Todo instrumento que pretenda ser científico, independientemente de su tipología y objetivo, debe enfrentarse a un proceso de obtención de validez. Tradicionalmente, se reconocen tres tipos de validez: la validez de contenido, de constructo y de criterio (Cronbach y Meehl, 1955). La validez de contenido evalúa de manera cualitativa si el instrumento mide lo que se pretende medir. En este caso, para evaluar la competencia futbolística de un jugador habrá que seleccionar las variables más representativas de acuerdo con la posición que desempeña. Para realizar esta labor, parece necesario acudir al juicio de expertos. Otra de las claves para validar este tipo de instrumentos es la validez de criterio, es decir, comparar los resultados obtenidos en el instrumento a validar con un criterio externo que pretenda medir lo mismo (Hernández et al., 2010), con el fin de asegurar que no existen diferencias significativas entre ambos criterios de medición. Por último, la validez de constructo se puede manifestar de diversas formas, utilizando en este tipo de instrumentos la perspectiva de validez discriminante, ya que permite validar si el instrumento es capaz de distinguir entre individuos que se espera que sean diferentes (Carvajal et al., 2011). En cuanto a la fiabilidad de los datos, dependen de forma directa de los proveedores, salvo que se usen herramientas ad hoc diseñadas con este propósito. Esto puede ser habitual en departamentos de análisis que pretenden recolectar datos de una determinada manera a partir de la observación. Si fuera así, es necesario asegurar que la herramienta es usada de forma homogénea por todos los analistas que intervienen en el proceso, de manera que se mida siempre de la misma forma. 

Procedimiento

El diseño del instrumento y el proceso de validación fueron realizados en seis etapas (ver figura 1), siguiendo el procedimiento desarrollado en otros estudios que han validado herramientas recientemente (Sánchez-López et al., 2021, 2023c, 2023b): (a) revisión bibliográfica y diseño provisional del instrumento determinando siete posibles posiciones de juego, con sus respectivas zonas de acción y métricas asociadas, (b) consulta y discusión con expertos para aprobar o modificar las posiciones de juego más utilizadas en los equipos, (c) validación de contenido del instrumento a partir del acuerdo entre expertos de las 12 variables más representativas en cada posición estudiada, (d) consulta y discusión con expertos para ajustar la ponderación de las variables tomando como referencia los datos extraídos de La Liga y la Premier League, así como las áreas de acción a filtrar para cada posición de juego, (e) validación de criterio, y (f) validación de constructo del instrumento.

Figura 1
Ver a tamaño completo
Etapas para el diseño y validación de “TOPSTATS”.

En la primera etapa, se realizó una revisión bibliográfica sobre estudios que analizasen las variables técnico-tácticas más significativas en cada posición de juego (Dellal et al., 2010, 2011; Firiteanu Vasile, 2013; Hughes et al., 2012; Van Lingen, 1997; Wiemeyer, 2003; Yi et al., 2018) y los datos espacio-temporales de las mismas (Konefał et al., 2019; Pappalardo et al., 2019b), así como estudios destinados al diseño de herramientas que evalúen el rendimiento deportivo a partir de los datos de proveedores (Brooks et al., 2016; Duch et al., 2010; Pappalardo et al., 2019a). 

A partir de esta revisión, se diseñó la herramienta provisional, que contó en un principio con siete posiciones de juego (portero, central, lateral derecho/izquierdo, medio defensivo, medio ofensivo, banda derecha/izquierda, delantero). Más tarde, serían incluidas dos nuevas posiciones de juego. Para cada posición de juego se seleccionaron las 12 variables más determinantes a juicio del investigador. Esta selección de variables estuvo condicionada por las métricas que ofrece el proveedor de suscripción Wyscout. En este caso, Wyscout pudo llegar a aportar un total de 111 variables sobre el jugador en el momento de validación de la herramienta, cuyos datos pueden ser descargados a partir de la opción “búsqueda avanzada”, filtrando por liga, periodo, posición, así como por cualquier variable que pretenda conducir la búsqueda. 

La selección provisional de variables para cada posición de juego no fue compartida con los expertos hasta la tercera etapa, sirviendo estos datos para compararlos con los datos extraídos del criterio de los expertos, y así validar la herramienta. En esta fase, también se determinaron de forma provisional las áreas de acción de cada posición de juego de acuerdo con el filtro posicional que ofrece Wyscout. Esta selección sería ajustada en la cuarta etapa a través de la discusión con expertos. 

A partir de la citada selección previa de variables por posiciones, se diseñaron en Excel unos archivos para el análisis y tratamiento de los datos obtenidos, que serían adaptados durante el proceso hasta obtener su versión final, de acuerdo con cada posición de juego. El software se centra en los datos de las 12 variables seleccionadas para cada posición, estableciendo 7 intervalos en función del dato mínimo y máximo de cada variable estudiada. Posteriormente, aquellos jugadores que cumplen el filtraje posicional son clasificados en el intervalo correspondiente en cada variable utilizando una escala de Likert 1-7, siendo 1 nada competente, y 7 muy competente. De este modo, se normalizan las variables para que todas “hablen el mismo lenguaje”. Por último, se obtiene un informe que muestra el índice de rendimiento de toda la muestra de jugadores analizados, a partir de la suma de las 12 calificaciones obtenidas, habiendo sido ponderadas según su nivel de relevancia en la posición de juego. 

En la segunda etapa, el investigador presentó, en una primera sesión de discusión, las posiciones de juego provisionales a los expertos, llegando al consenso de incluir nuevas posiciones de juego para reflejar de mejor manera las más comunes en un equipo de fútbol. De este modo, se tuvieron en cuenta nueve posiciones de juego (portero, central, lateral derecho/izquierdo, medio centro defensivo, medio box-to-box, medio creativo, banda derecha/izquierda, extremo derecho/izquierdo, delantero). Una vez hecho esto, y para finalizar la primera sesión de discusión, el investigador acordó con los expertos el envío de un listado de 108 variables para que seleccionasen, de forma independiente, las más relevantes por posición de juego, antes de volver a establecer una nueva sesión de discusión.

En la tercera etapa, los expertos, de forma independiente, tuvieron que señalar las 12 variables que consideraban más relevantes para cada una de las posiciones de juego a la hora de valorar la competencia futbolística de los jugadores en dichas posiciones. Se permitió la selección de 102 de las 111 variables que ofrece Wyscout, ya que se descartaron el nombre del jugador, debido a que es la variable representativa del jugador, la posición específica, ya que se utilizó esta variable para el filtraje, el valor de mercado que se utilizaría, posteriormente, para realizar el proceso de validez de constructo de la herramienta, además de otras variables que no ofrecían datos cuantitativos o relevantes a juicio del investigador (equipo actual, vencimiento contrato, país de nacimiento, pasaporte, pie, en préstamo). Se decidió no descartar otras variables que, pese a no tener una relación directa con la evaluación del juego, pudieran ser importantes para determinar el rendimiento de los jugadores. Por ejemplo, en referencia a la variable minutos jugados, aquellos jugadores con mayor volumen de participación en sus equipos suelen ser los jugadores más competentes. La variable edad también podría influir en el rendimiento a medio-largo plazo en los jugadores más jóvenes.  La variable altura puede ser determinante en la posición del portero. También se les aportó el glosario de eventos de Wyscout que describe cada una de las variables (https://dataglossary.wyscout.com/). 

Para realizar este proceso se utilizó el software Excel. El investigador también tuvo que realizar esta tarea con las nuevas posiciones de juego validadas durante la primera sesión de discusión. Una vez hecho esto, y habiendo el investigador recibido los archivos, se procedió al cálculo de la validez de contenido. De esta forma, se recurrió a la concordancia de las selecciones de los dos expertos, así como de la selección provisional realizada por el investigador, comparando los datos de forma conjunta a través del coeficiente kappa de Fleiss, así como por pares, utilizando el coeficiente kappa de Cohen. Obtenido un acuerdo lo suficientemente alto, se realizó una segunda discusión con los dos expertos, mostrándoles la selección provisional de variables para cada posición realizada por el experimentador, así como las dos selecciones realizadas por ellos mismos. Una vez hecho esto, se aprobaron todas las variables que habían sido seleccionadas por los tres expertos para cada posición, mientras que se discutieron aquellas variables que habían sido seleccionadas por uno o dos expertos, hasta llegar a consenso sobre su inclusión/exclusión, y determinar las 12 variables más representativas para cada posición de juego. Para la posición de delantero se decidió incluir una métrica resultante del número de goles dividido entre el número de remates.

En la cuarta etapa, se realizaron una tercera y cuarta sesión de discusión con los dos expertos para ponderar las 12 variables seleccionadas para cada posición. Para ello, se utilizaron los datos de la temporada 2019-2020 de la Primera División española (jornadas 1 a 27) y de la Premier League inglesa (jornadas 1 a 29), y se inició la discusión con las variables sin ponderar, es decir, todas tenían el mismo peso a la hora de valorar el rendimiento de los jugadores. Este proceso se decidió realizar en común, y no de forma independiente, ya que tanto los expertos como el investigador podían aportar sus ideas y conocimientos sobre cómo podía influenciar cada una de las variables, teniendo en cuenta la dependencia directa que siempre tendrían con el perfil de jugador deseado y el estilo de juego desde el que se esté evaluando. 

En la tabla 1 se muestra la relación de variables seleccionadas, así como su ponderación. Paralelamente a este proceso, y tal como se ha mencionado en la etapa 1, se fueron ajustando las áreas de acción de cada posición de juego a través del análisis de los jugadores que iban apareciendo o desapareciendo cuando se seleccionaba o no cualquiera de las áreas en el filtro que ofrece Wyscout. De este modo, se determinaron las áreas más pertinentes para cada posición de juego. La figura 2 muestra las zonas filtradas para cada posición de juego una vez fueron ajustadas después del proceso mencionado.

Tabla 1

Variables seleccionadas para cada posición y su ponderación a partir del consenso de los expertos.

Ver Tabla

Figura 2
Ver a tamaño completo
Filtro posicional de jugadores según posición de juego.

En la quinta etapa, se calculó la validez de criterio del instrumento, que estima el grado de acuerdo con algún criterio externo que pretenda medir lo mismo. Para ello, se compararon los índices de rendimiento de los jugadores obtenidos en TOPSTATS a partir de la puntuación total ponderada en cada posición de juego, con las puntuaciones de los jugadores en Sofascore. En Sofascore las puntuaciones de los jugadores están calculadas de forma objetiva a través de los datos del proveedor Opta.

En la sexta etapa, para estimar la validez de constructo, se utilizó la perspectiva de validez discriminante (Carvajal et al., 2011), que mide el grado en el que el instrumento es capaz de distinguir entre grupos de individuos que se espera que sean diferentes (McDowell y Newell, 1996), debido a sus características o rendimiento (Thomas et al., 2011). En este caso particular, se utilizó el valor de mercado de los jugadores para determinar si se relacionaba con la puntuación general obtenida en TOPSTATS. 

Análisis de datos

Para calcular la validez de contenido se recurrió a la consulta con expertos, tal y como se ha descrito en la tercera etapa del procedimiento. A través de este proceso, se utilizó el índice kappa de Fleiss a partir del complemento “Real Statistics” de Excel para calcular el grado de acuerdo entre los 3 expertos, a la hora de seleccionar las 12 variables más relevantes en cada una de las posiciones de juego. Este procedimiento permite obtener el grado de concordancia entre dos o más observadores, y aunque suele usarse habitualmente como una medida de fiabilidad, dada la singularidad de este estudio, se consideró que era la mejor manera para acometer este paso en cuanto a validez de contenido de la herramienta, ya que se pretendía verificar si en cada posición se estaba midiendo lo que se quería medir, según las variables seleccionadas por los expertos, sabiendo que en la mayoría de los deportes se encuentra que los indicadores de rendimiento importantes varían de un entrenador a otro (Hughes et al., 2012). De igual modo, como procedimiento complementario, se recurrió al software SPSS v.19 utilizando el índice de acuerdo kappa de Cohen (1988) por pares de observadores, que permitiría llegar al mismo resultado final de distinta forma.

En la quinta y sexta etapa del procedimiento empleado, se usó la correlación de Pearson para determinar la validez de criterio y de constructo de la herramienta, relacionando las puntuaciones totales de los jugadores obtenidas en TOPSTATS con las de Sofascore y con su valor de mercado, respectivamente. 

Resultados

En cuanto a la validez de contenido, se obtuvo un índice kappa de Fleiss (k = .691) que mostró un acuerdo considerable entre los tres observadores según la escala de interpretación propuesta por Landis y Koch (1977).  Para la concordancia por pares de observadores, se obtuvo un promedio similar (k = .691) a partir del índice kappa de Cohen. En la tabla 2 se puede visualizar la concordancia por pares.

Tabla 2

Concordancia por pares kappa de Cohen.

Ver Tabla

Para la validez de criterio, se relacionaron las puntuaciones totales de los jugadores obtenidas en TOPSTATS con las de Sofascore a través del índice de correlación de Pearson (ver tabla 3), existiendo evidencias significativas de asociación (r = 0.3–0.88; p < .05) en todas las posiciones de juego.

Tabla 3

Correlación de Pearson entre Índice de Rendimiento General (total ponderado) en TOPSTATS y ratings en Sofascore de jugadores con más de 800 minutos jugados en la Liga y la Premier 2019-20.

Ver Tabla

Por último, para estimar la validez de constructo de la herramienta, se correlacionaron las puntuaciones totales de los jugadores obtenidas en TOPSTATS con su valor de mercado extraído desde Wyscout en el momento del análisis. En este caso, existieron evidencias significativas de asociación en 17 de las 24 posiciones de juego (r = 36-80; p < .05), exceptuando las posiciones de lateral izquierdo en La Liga española, y de medios box-to-box y bandas derechas e izquierda en ambas competiciones (ver tabla 4).

Tabla 4

Correlación de Pearson entre Índice de Rendimiento General (total ponderado) en TOPSTATS y el valor de mercado de jugadores con más de 800 minutos jugados en La Liga y la Premier League 2019-20.

Ver Tabla

Discusión

El objetivo del presente estudio consistió en diseñar y validar un instrumento que permitiese calificar, clasificar y comparar el rendimiento global de los jugadores profesionales, entendido como la competencia futbolística que muestran a lo largo de sus actuaciones, a partir del proveedor de datos Wyscout. El instrumento desarrollado analiza de forma semiautomática datos extraídos desde el proveedor Wyscout, y aporta una calificación del jugador, en forma de índice de rendimiento global, en función de su posición y en relación con jugadores que juegan en su mismo puesto y en su misma liga. De este modo, se pueden establecer comparaciones entre jugadores de forma ágil, aspecto determinante cuando se trabaja en clubes deportivos donde el tiempo apremia y los procesos de análisis se realizan a un ritmo vertiginoso. Además, este proceso se puede llevar a cabo en más de 200 competiciones que cuentan con cobertura de datos por parte de Wyscout.

La competencia futbolística ha sido estudiada en recientes trabajos analizándola desde un sistema de observación (Sánchez-López et al., 2021), o describiendo las conductas colectivas de acuerdo con el nivel de competencia futbolística que muestran los participantes (Nieto et al., 2022). Como concepto central de este trabajo, se revela ante equipos muy distintos por la capacidad que tiene el jugador para adaptarse a los comportamientos de los otros jugadores, para participar de una estrategia colectiva, para dar prueba de empatía y anticipación en el puesto, para acertar en sus conductas desarrolladas durante el partido (Parlebas, 2018). Es por ello que «actuaciones» y «competencia» son dos términos indisociables, ya que las actuaciones son producto de una competencia, y el rendimiento durante las actuaciones es el mejor indicador de la competencia de los jugadores. 

Asegurar la validez de cualquier instrumento que pretenda valorar el rendimiento de los jugadores es un paso necesario a la hora de poder garantizar la calidad de la evaluación. Uno de los problemas que suele aparecer al tratar de obtener evidencias de validez de contenido a través del conocimiento de expertos es que no suele estar disponible un listado del contenido correcto del fenómeno que se va a medir y por lo tanto hay que establecerlo (Carvajal et al., 2011). En el caso de este estudio, el investigador principal aportó un listado detallado de todas las métricas que pueden ser extraídas desde Wyscout, teniendo los expertos que establecer qué métricas eran las más interesantes para cada posición de juego. Esta parte de la investigación se realizó con sumo cuidado y paciencia, con el fin de garantizar el consenso por parte de los expertos en la selección de las variables que identificasen cada perfil posicional, así como los pesos asociados a cada variable. El conocimiento, por parte de los expertos, del rendimiento de jugadores, tanto en La Liga como en la Premier League, permitió poder ajustar estos pesos con el fin de obtener unas puntuaciones totales en línea con la realidad.

Para obtener evidencias de validez de criterio se utilizaron como criterio externo que pretendiese medir lo mismo las puntuaciones de la plataforma Sofascore. Estas puntuaciones resultan del tratamiento de datos que brinda el proveedor Opta, y cuya fiabilidad fue evidenciada en un estudio previo (Liu et al., 2013). Sofascore, al tiempo de publicación de este trabajo, sigue aumentando su cobertura de datos, pero no llega a la cobertura de datos que presenta Wyscout, por lo que una herramienta como TOPSTATS podría servir para obtener los índices de rendimiento globales en un mayor volumen de países y divisiones. Por ejemplo, en el caso de España, se podrían obtener índices de rendimiento en divisiones como la 1.ª RFEF o 2.ª RFEF española que, a la fecha de presentación de este trabajo, no cuentan con el soporte de Sofascore. 

Con respecto a la validez de constructo, se pudo evidenciar como en 7 de las 24 posiciones analizadas no se obtuvo relación entre la calificación de los jugadores y el valor de mercado. Esto fue debido a que el valor de mercado no solo viene representado por el rendimiento que muestran los jugadores sino también por su potencial y posibilidades de futuro. Por ello, la edad es una variable que puede sesgar los resultados en determinadas posiciones, ya que jugadores experimentados que se acercan a sus últimos años de carrera tenían valores de mercado muy bajos. Por ejemplo, Joaquín y Cazorla en La Liga española, ambos rindiendo a un nivel altísimo en posiciones de banda. Específicamente en estas posiciones de banda, ocurre también que los expertos trataron de identificar un perfil de jugador más multifuncional a diferencia de las posiciones ocupadas por extremos, con características especialmente ofensivas. Otro inconveniente encontrado, para garantizar la validez de constructo de la herramienta, fue que las posiciones de medios creativos y box-to-box comparten filtraje espacial, es decir, muchos jugadores fueron calificados en ambas posiciones, ya que se desempeñaron en la zona central del campo. Esto se tradujo en que muchos jugadores que obtuvieron altas puntuaciones como medios creativos tuvieron puntuaciones bajas como medios box-to-box, debido a que las variables de análisis son diferentes, sesgando también los resultados debido a su valor de mercado; ya que los mejores medios creativos (De Bruyne, Maddison, David Silva, Tony Kroos, Odegaard…) tenían valores de mercado mayores que los mejores medios box-to-box (Mikel Merino, Saúl Ñíguez, Fred, Ward-Prowse…). En el caso de los laterales izquierdos de La Liga española, no se encontró relación significativa entre puntuación y valor de mercado. Esto fue seguramente debido a que varios jugadores con valores de mercado bajos rindieron a gran nivel durante la temporada (Estupiñán, José Ángel, Fran Gámez, Lucas Olaza, Toño…) y, al mismo tiempo, a que varios jugadores con alto valor de mercado no rindieron al nivel que se esperaba (Gaya, Jordi Alba, Mendy…).

En cuanto a las limitaciones del estudio, por un lado, la limitación principal de la herramienta gira en torno a su dependencia con el proveedor de datos, ya que los ficheros fueron codificados tomando como referencia la base de datos que se puede descargar a través de Wyscout. Esto representa un pequeño inconveniente, ya que el proveedor podría cambiar en cualquier momento la forma de exportación de datos, lo que supondría tener que realizar modificaciones en el código de la herramienta. Por otro lado, parece interesante mencionar que las variables centradas en la relación con el balón, ampliamente utilizadas para evaluar el rendimiento en deportes colectivos, deben ser juzgadas con cuidado al comparar jugadores de distintas divisiones y categorías (Sánchez-López et al., 2023a). Aunque las ligas puedan tener un nivel de juego parecido, los contextos de confrontación pueden ser diferentes debido al sistema cultural. Respecto a esta idea, parece también importante señalar que es necesario reflexionar sobre las variables de selección por posición y la ponderación de estas a la hora de determinar qué jugador del equipo puede ser el adecuado para jugar de titular en un partido, o qué jugadores del mercado pueden resultar idóneos para incorporar al club. Respecto a este hecho, el estilo de juego del equipo desempeña un papel clave en la victoria (Kong et al., 2022), así como en el tipo de acciones que son más interesantes para el buen rendimiento colectivo. En este sentido, la selección de variables y ponderaciones que se presentan en este trabajo han sido minuciosamente validadas, tratando de responder a cualquier estilo de juego, por lo que no se recomienda realizar modificaciones muy drásticas, ya que se podría perder cierta validez en este proceso.

Las ciencias del deporte mantienen un esfuerzo continuado en relación con la aplicación de nuevas metodologías y sistemas de entrenamiento para mejorar y mantener el rendimiento de los y las deportistas (Pons Alcalá et al., 2020). En consecuencia, el instrumento validado en este estudio tiene innumerables posibilidades de aplicabilidad en el ámbito deportivo y académico, entre las que se podrían destacar: (1) en el propio equipo, se puede analizar y comparar el rendimiento de jugadores que comparten una misma posición, con el fin de identificar qué jugador puede ser más adecuado para un determinado partido, o qué jugador está rindiendo mejor en dicha posición de acuerdo con sus actuaciones; (2) también se puede analizar el rendimiento de jugadores del propio equipo y jugadores de equipos de la liga, estableciendo comparaciones y clasificaciones por posición de juego; (3) otra alternativa gira en torno a la valoración de posibles incorporaciones teniendo en cuenta el rendimiento que muestran los jugadores; (4) también es posible evaluar la evolución de los jugadores comparando su rendimiento longitudinalmente, por ejemplo, de una temporada a otra, o en dos diferentes periodos de una liga. 

En cuanto a las prospectivas de futuro de la herramienta, dependen directamente del futuro del proveedor, sabiendo que el escenario que se presenta es muy ilusionante, ya que los proveedores cada vez ofrecen una mayor cantidad de datos y de mucha más calidad. 

Conclusiones

Como conclusiones del estudio cabe mencionar que TOPSTATS muestra unos valores de validez óptimos. Es un instrumento capaz de calificar, clasificar y comparar la competencia futbolística que muestran los jugadores profesionales en sus actuaciones durante una misma competición, de acuerdo con su posición de juego. Para ello, la herramienta permite calcular, de una forma ágil y semiautomática, un índice de rendimiento global obtenido a partir de la interacción y ponderación de variables que contienen los datos obtenidos desde el proveedor Wyscout, que cuenta con cobertura de datos en más de 200 competiciones.

Por todo ello, el instrumento podría ser utilizado por clubes profesionales, departamentos de análisis del rendimiento deportivo y entrenadores para analizar y comparar a los jugadores, permitiendo una mayor optimización de los procesos de entrenamiento y evaluación. De igual modo, en el ámbito científico, el instrumento podría ser útil en investigaciones que precisen crear grupos de estudio en torno al rendimiento en competición que presentan los jugadores.

Declaración de conflicto de intereses

Los autores declaran que no existen potenciales conflictos de intereses con respecto a la investigación, autoría y/o publicación de este artículo.

Financiamiento

Los autores no recibieron apoyo financiero para la investigación, autoría y/o publicación de este artículo.

Referencias

[1] Anderson, C. & Sally, D. (2014). The numbers game: why everything you know about soccer is wrong. En Choice Reviews Online. London: Penguin Books.

[2] Araújo, D. (2005). A acçao táctica no desporto. Uma persectiva geral. En O context da decisão. A acção táctica no desporto (Visão e co)

[3] Berrar, D., Lopes, P., Davis, J. & Dubitzky, W. (2019). Guest editorial: special issue on machine learning for soccer. Machine Learning, 108, 1-7. https://doi.org/10.1007/s10994-018-5763-8

[4] Bornn, L., Cervone, D. & Fernandez, J. (2018). Soccer analytics: Unravelling the complexity of “the beautiful game”. Significance, Volume 15, Issue 3, June 2018, Pages 26–29. https://doi.org/10.1111/j.1740-9713.2018.01146.x

[5] Brooks, J., Kerr, M. & Guttag, J. (2016). Developing a data-driven player ranking in soccer using predictive model weights. Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. https://doi.org/10.1145/2939672.2939695

[6] Carvajal, A., Centeno, C., Watson, R., Martínez, M. & Sanz Rubiales, Á. (2011). ¿Cómo validar un instrumento de medida de la salud? Anales del Sistema Sanitario de Navarra, 34(1), 63-72. https://doi.org/10.4321/s1137-66272011000100007

[7] Castellano, J. & Clemente, F. M. (2020). How much does ball possession influence match performance? Integrating physical and tactical data. En Barça Innovation Hub (Ed.), Football Analytics: Now and Beyond (pp. 94-109). FC Barcelona.

[8] Castellano, J. & Echeazarra, I. (2019). Network-based centrality measures and physical demands in football regarding player position: Is there a connection? A preliminary study. Journal of Sports Sciences, 37(23). https://doi.org/10.1080/02640414.2019.1589919

[9] Cohen, J. (1988). Statistical power analysis for the behavioral sciences. New York: Routledge. https://doi.org/10.4324/9780203771587

[10] Coutinho, D., Gonçalves, B., Santos, S., Travassos, B., Folgado, H. & Sampaio, J. (2022). Exploring how limiting the number of ball touches during small-sided games affects youth football players’ performance across different age groups. International Journal of Sports Science and Coaching, 17(3), 545-557. https://doi.org/10.1177/17479541211037001

[11] Cronbach, L. J. & Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin. 52(4), 281–302. https://doi.org/10.1037/h0040957

[12] Dellal, A., Chamari, K., Wong, D. P., Ahmaidi, S., Keller, D., Barros, R., Bisciotti, G. N. & Carling, C. (2011). Comparison of physical and technical performance in European soccer match-play: Fa Premier League and La Liga. European Journal of Sport Science, 11(1), 51-59. https://doi.org/10.1080/17461391.2010.481334

[13] Dellal, A., Wong, D. P., Moalla, W. & Chamari, K. (2010). Physical and technical activity of soccer players in the French first league- with special reference to their playing position. International SportMed Journal, 11(2), 278-290.

[14] Díez, A., Lozano, D., Arjol-Serrano, J. L., Mainer-Pardos, E., Castillo, D., Torrontegui-Duarte, M., Nobari, H., Jaén-Carrillo, D. & Lampre, M. (2021). Influence of contextual factors on physical demands and technical-tactical actions regarding playing position in professional soccer players. BMC Sports Science, Medicine and Rehabilitation, 13(1). https://doi.org/10.1186/s13102-021-00386-x

[15] Duch, J., Waitzman, J. S. & Nunes Amaral, L. A. (2010). Quantifying the performance of individual players in a team activity. PLoS ONE, 5(6), 1-7. https://doi.org/10.1371/journal.pone.0010937

[16] Errekagorri, I., Castellano, J. & Echeazarra, I. (2020). Analysis of the ball possession in youth soccer in relation to situational variables: Case study. Cuadernos de Psicología del Deporte, 20(2). https://doi.org/10.6018/CPD.370261

[17] Firiteanu Vasile, N. (2013). The technical study for different game positions in the 2nd League. Ovidius University Annals, Series Physical Education & Sport/Science, Movement & Health, XIII(2), 795-802.

[18] Garganta, J. & Gréhaigne, J. F. (1999). Abordagem sistêmica do jogo de futebol: Moda ou necessidade? Revista Movimento: Universidad Federal de Rio Grande du Sol: Brasil., 5(10), 40-50. https://doi.org/10.22456/1982-8918.2457

[19] Gréhaigne, J.-F., Bouthier, D. & David, B. (1997). Dynamic-system analysis of opponent relationships in collective actions in soccer. Journal of Sports Sciences. https://doi.org/10.1080/026404197367416

[20] Hernández Moreno, J. (1995). La diversidad de prácticas. Análisis de la estructura de los deportes para su aplicación a la iniciación deportiva. En D. Blázquez (Ed.) La iniciación deportiva y el deporte escolar (pp. 287-310). Barcelona: INDE.

[21] Hernández, R., Fernández, C. & Baptista, P. (2010). Metodología de la Investigación. México DF: McGraw Hill.

[22] Hughes, M., Caudrelier, T., James, N., Redwood-Brown, A., Donnelly, I., Kirkbride, A. & Duschesne, C. (2012). Moneyball and soccer - An analysis of the key performance indicators of elite male soccer players by position. Journal of Human Sport and Exercise, 7(2), 402-414. https://doi.org/10.4100/jhse.2012.72.06

[23] Izzo, R., Rossini, U., Raiola, G., Cejudo Palomo, A. & Hosseini Varde’I, C. (2020). Insurgence of fatigue and its implications in the selection and accuracy of passes in football. A case study. Journal of Physical Education and Sport, 20(4), 1996-2002. https://doi.org/10.7752/jpes.2020.04269

[24] Konefał, M., Chmura, P., Zajac, T., Chmura, J., Kowalczuk, E. & Andrzejewski, M. (2019). A New Approach to the Analysis of Pitch-Positions in Professional Soccer. Journal of Human Kinetics, 66, 143-153. https://doi.org/10.2478/hukin-2018-0067

[25] Kong, L., Zhang, T., Zhou, C., Gómez, M.-A., Hu, Y. & Zhang, S. (2022). The evaluation of playing styles integrating with contextual variables in professional soccer. Frontiers in Psychology, 13, 1002566. https://doi.org/10.3389/fpsyg.2022.1002566

[26] Landis, J. R. y Koch, G. G. (1977). The Measurement of Observer Agreement for Categorical Data. Biometrics, 33, 159-174. https://doi.org/10.2307/2529310

[27] Lasierra, G. (1993). Análisis de la interacción motriz en los deportes de equipo. Aplicación de los universales ludomotores al balonmano. Apunts Educación Física y Deportes, 32, 37-53.

[28] León, O. G. & Montero, I. (2007). A guide for naming research studies in Psychology. International Journal of Clinical and Health Psychology, 7(3), 847-862.

[29] Liu, H., Hopkins, W., Gómez, M. A. & Molinuevo, J. S. (2013). Inter-operator reliability of live football match statistics from OPTA Sportsdata. International Journal of Performance Analysis in Sport. https://doi.org/10.1080/24748668.2013.11868690

[30] McDowell, I. & Newell, C. (1996). Measuring healh: a guide to rating scales and questionnaires. Oxford: Oxford University Press.

[31] Nieto, S., Castellano, J. & Echeazarra, I. (2022). Description of collective behaviour in football according to the level of competence in representative tasks from positional data: Systematic review. International Journal of Sports Science and Coaching, 17(6), 1553-1566. https://doi.org/10.1177/17479541221088640

[32] Otero-Saborido, F. M., Aguado-Méndez, R. D., Torreblanca-Martínez, V. M. & González-Jurado, J. A. (2021). Technical-tactical performance from data providers: A systematic review in regular football leagues. En Sustainability (Vol. 13, no. 18). https://doi.org/10.3390/su131810167

[33] Pappalardo, L., Cintia, P., Ferragina, P., Massucco, E., Pedreschi, D. & Giannotti, F. (2019a). PlayeRank: Data-driven performance evaluation and player ranking in soccer via a machine learning approach. ACM Transactions on Intelligent Systems and Technology, 10(5), 1-27. https://doi.org/10.1145/3343172

[34] Pappalardo, L., Cintia, P., Rossi, A., Massucco, E., Ferragina, P., Pedreschi, D. & Giannotti, F. (2019b). A public data set of spatio-temporal match events in soccer competitions. Scientific Data, 6(236). https://doi.org/10.1038/s41597-019-0247-7

[35] Parlebas, P. (2001). Juegos, Deporte y Sociedad. Léxico de praxiología motriz. Badalona: Paidotribo.

[36] Parlebas, P. (2018). Une pédagogie des compétences motrices. Acciónmotriz, 20, 89-96. https://dialnet.unirioja.es/servlet/articulo?codigo=6435703

[37] Parlebas, P. (2023). Pasado, presente y futuro de la praxiología motriz. Acciónmotriz, 31, 9-19.

[38] Partovi, F. Y. & Corredoira, R. A. (2002). Quality function deployment for the good of soccer. European Journal of Operational Research. https://doi.org/10.1016/S0377-2217(01)00072-8

[39] Pons Alcalá, E., Martin Garcia, A., Guitart Trench, M., Guerrero Hernández, I., Ramon Tarragó, J., Seirul·lo Vargas, F. & Cos Morera, F. (2020). Entrenamiento en deportes de equipo: el entrenamiento optimizador en el Fútbol Club Barcelona. Apunts Educación Física y Deportes, 141. https://doi.org/10.5672/apunts.2014-0983.es.(2020/4).142.07

[40] Ric, A., Torrents, C., Gonçalves, B., Sampaio, J. & Hristovski, R. (2016). Soft-assembled multilevel dynamics of tactical behaviors in soccer. Frontiers in Psychology, 7(OCT). https://doi.org/10.3389/fpsyg.2016.01513

[41] Sánchez-López, R., Echeazarra, I. & Castellano, J. (2021). Validation of a Football Competence Observation System (FOCOS), Linked to Procedural Tactical Knowledge. Sustainability, 13(12), 6780. https://doi.org/https://doi.org/10.3390/su13126780

[42] Sánchez-López, R., Echeazarra, I. & Castellano, J. (2023a). Comparing semi-professional and amateur game contexts in a Gk+4 vs. 4+Gk via Football Competence (Procedural Tactical Knowledge). Retos, 47, 419-429. https://doi.org/10.47197/retos.v47.94576

[43] Sánchez-López, R., Echeazarra, I. & Castellano, J. (2023b). Validación de un instrumento de codificación para analizar los goles en fútbol (CODITAG). Apunts Educación Física y Deportes, 151, 58-69. https://doi.org/10.5672/apunts.2014-0983.es.(2023/1).151.06

[44] Sánchez-López, R., Echeazarra, I. & Castellano, J. (2023c). Validation of “TesTactico for F7”: A tool to analyse Declarative Tactical Knowledge based on a Football Competence Observation System. Cuadernos de Psicología del Deporte, 23(2), 223-239. https://doi.org/https://doi.org/10.6018/cpd.526421

[45] Thomas, J. R., Nelson, J. & Silversman, S. (2011). Research Methods in Physical Activity. Champaign, IL: Human Kinetics.

[46] Van Lingen, B. (1997). Coaching Soccer. Spring City, PA: Reedswain.

[47] Wiemeyer, J. (2003). Who should play in which position in soccer? Empirical evidence and unconventional modelling. International Journal of Performance Analysis in Sport, 3(1), 1-18. https://doi.org/10.1080/24748668.2003.11868269

[48] Yi, Q., Jia, H., Liu, H. & Gómez, M. Á. (2018). Technical demands of different playing positions in the UEFA Champions League. International Journal of Performance Analysis in Sport, 18(6), 926-937. https://doi.org/10.1080/24748668.2018.1528524

[49] Zeng, Z. & Pan, B. (2021). A Machine Learning Model to Predict Player’s Positions based on Performance. International Conference on Sport Sciences Research and Technology Support, icSPORTS - Proceedings, October, 36-42. https://doi.org/10.5220/0010653300003059

ISSN: 2014-0983

Recibido: 11 de enero de 2023

Aceptado: 12 de mayo de 2023

Publicado: 1 de octubre de 2023