Partido Francia-Polonia en Barcelona

Mundial 2026: España declarada ganadora tras 100.000 simulaciones

¿Levantarán el trofeo España, Francia o Inglaterra? Utilizando datos de miles de partidos, los estadísticos simularon la Copa Mundial de Fútbol de 2026 100.000 veces para identificar los escenarios más probables.

Antaño, para saber qué equipo iba a ganar el Mundial había que consultar clarividentes de bolas de cristal, leer el futuro en hojas de té o esperar que el Pulpo Pablo nos dijera lo que iba a pasar.

Hoy en día, la ciencia de datos ofrece una alternativa más confiable. Como parte de un equipo de estadísticos, ayudé a entrenar un algoritmo de aprendizaje automático para predecir el escenario más probable del torneo.

Pronósticos probabilísticos y dados cargados

El algoritmo que diseñamos funciona en dos pasos. En primer lugar, se combinan modelos estadísticos sofisticados con análisis de casas de apuestas y datos del mercado de transferencias para evaluar la fortaleza de todos los equipos y sus jugadores. En segundo lugar, un algoritmo de aprendizaje automático determina la mejor manera de combinar estas estimaciones con otra información del equipo.

Este enfoque produce un pronóstico probabilístico para cada posible partido del torneo. Podemos imaginarlo como un par de dados cargados: en lugar de presentar los números del 1 al 6 con la misma probabilidad, estos dados asignan probabilidades diferentes al número de goles que es probable que marque cada equipo.

Por ejemplo, según nuestro pronóstico, el dado de México produce un promedio de 1,9 goles en el partido inaugural, mientras que el de su oponente, Sudáfrica, produce sólo 0,7. Sin embargo, esto no significa que México ganará definitivamente. Una victoria mexicana es simplemente el resultado más probable, con una probabilidad del 65%. Un empate es menos probable (21%), mientras que una victoria de Sudáfrica es el escenario menos probable (14%).

“¡Vuelve a casa, el fútbol vuelve a casa!” »

Utilizando diferentes pares de dados cargados, es posible simular el resultado de cada partido de la Copa del Mundo. Hemos tenido en cuenta el sorteo oficial del torneo, así como todas las reglas de la FIFA, incluidas las prórrogas y la tanda de penaltis. Luego realizamos 100.000 simulaciones para determinar el escenario más probable para la competición.

Los resultados muestran que España es la favorita al título, con una probabilidad de ganar del 14,5%. Le siguen de cerca Inglaterra y Francia, ambos con un 12,4%, y luego Alemania con un 11,2%.

Debido a la ampliación del torneo -este Mundial reúne a 48 selecciones y tiene cinco rondas de eliminación directa-, las diferencias entre los favoritos siguen siendo relativamente pequeñas. Portugal y Argentina también tienen sólidas posibilidades de ganar el trofeo, con un 8,9% y un 8,2% de probabilidad de victoria final respectivamente.

Por su parte, Estados Unidos tiene buenas posibilidades de llegar a octavos de final: 78%. Esta es la probabilidad más alta en su grupo, que incluye a otros tres equipos. Por otro lado, durante la fase eliminatoria, donde cada partido es decisivo, las posibilidades del equipo estadounidense de continuar su camino disminuyen con bastante rapidez. La probabilidad de que el país anfitrión levante el trofeo en la final disputada en el MetLife Stadium el 19 de julio es sólo del 1%.

Detrás de escena de la modelo.

Nuestro algoritmo de aprendizaje automático y las simulaciones resultantes se basan en una combinación de datos, experiencia y modelos estadísticos.

En primer lugar, todos los partidos internacionales jugados en los últimos ocho años sirven como base para una evaluación retrospectiva del nivel de los equipos. Luego, se establece una estimación prospectiva basada en las cuotas ofrecidas por diferentes casas de apuestas internacionales, que reflejan su evaluación experta del próximo torneo.

urtak hoti tItW13fbIpU unsplash escalado

En tercer lugar, las valoraciones individuales de los jugadores se establecen en función de su contribución a los goles marcados tanto para el club como para la selección nacional. Finalmente, la calidad actual de los jugadores y su potencial futuro se entienden a través de su valor de mercado estimado. Estos datos están disponibles en el sitio web Transfermarkt, que se basa en un enfoque basado en la inteligencia colectiva para estimar los valores de mercado que, por naturaleza, siguen siendo desconocidos.

Luego, estas cuatro variables se combinan con una amplia gama de otros indicadores relevantes que describen el estado actual de los diferentes equipos y los países que representan. Esto incluye elementos específicos de las selecciones, como su clasificación FIFA o el número de jugadores que llegaron a las semifinales de la Liga de Campeones este año. También incorporamos factores socioeconómicos específicos de cada país, como el PIB per cápita.

Para determinar si estas variables realmente influyen en los resultados de una Copa del Mundo y en qué medida, utilizamos un algoritmo de aprendizaje automático.

Específicamente, utilizamos lo que se llama un bosque aleatorio (), un modelo que consta de una gran cantidad de árboles de decisión, cada uno de ellos entrenado en subconjuntos de datos ligeramente diferentes. El algoritmo se entrenó en todos los partidos jugados en las principales competiciones internacionales desde la Copa del Mundo de 2006.

Así aprende a relacionar el nivel de los equipos, el valor de mercado de sus jugadores y otros factores con el número de goles marcados en los partidos del Mundial. Es esta información la que nos permite «canalizar los dados» utilizados en nuestras simulaciones.

¿Qué confiabilidad?

No es la primera vez que nuestro equipo, formado por Andreas Groll, Rouven Michels y sus colegas de la Universidad Técnica de Dortmund en Alemania, así como Lars Magnus Hvattum de la Universidad de Molde en Noruega, Gunther Schauberger de la Universidad Técnica de Munich y yo, colaboramos para predecir el resultado de una Copa del Mundo.

Durante la Copa Mundial Femenina de 2019, nombramos correctamente a Estados Unidos como los eventuales ganadores. En la Copa Mundial Femenina de 2023 y en la Copa Mundial Masculina de 2022, los equipos coronados (España y Argentina) no eran nuestros favoritos, a pesar de que nuestro modelo los identificó como serios contendientes al título.

La lección principal es que un pronóstico se basa en probabilidades. Nuestro programa no pretende predecir el ganador con absoluta certeza. Pero quizás tenga más posibilidades de éxito que un molusco de ocho brazos.La conversación

 

turismo