No es difícil suponer que, cada segundo que pasa, un algoritmo se hace cargo de una tarea que antes realizaba una persona. Frente a esa lenta invasión, imparable y persistente como la lava de un volcán extendiéndose, existe la tendencia romántica de negar la evidencia y creer que basta con subirse a una roca con un cubo de hielo para defenderse del avance.

Esa actitud nostálgica hace que veamos con ojos del siglo veinte una realidad del veintiuno, lo que impide que entendamos qué es lo que está pasando. Lo que consideramos relevante ya no lo es y lo fundamental sigue escondido porque nos empeñamos en no verlo. Esto se manifiesta en cualquier actividad. La política. La economía. Y en el deporte, claro, en el deporte también: hay que acostumbrarse a ver, junto al entrenador trajeado en la banda, a un algoritmo dando también su opinión. Un algoritmo que podemos imaginarnos como uno de esos personajes de trazo simple que hacen de guías del más acá en la película Soul.

Quizás así se puedan comprender las razones de fichajes aparentemente injustificables, alineaciones que parecen no tener sentido, estrategias inesperadas o descartes de jugadores que, tras triunfar como cedidos, vuelven a dejar el equipo. En la mesa del director deportivo está ya sentado un algoritmo al que se escucha y se tiene en cuenta. Un algoritmo, por cierto, al que nadie le va a quitar su sitio.

¿Cuándo y por qué se le abrió la puerta para que sus conclusiones influyan así en la estrategia de un equipo? Seguramente habrá una fecha precisa, pero, por pereza y comodidad, dejaremos que sea Hollywood quien lo haga, poniendo con la película Moneyball la atención en el año 2001. Vayamos, pues, al 2001 y fijémonos en un equipo de béisbol de California, los Oakland Athletics —o A’s— y en Billy Beane, su director general desde 1997.

Ese año, los A’s pierden a tres de sus jugadores más importantes (Jason Giambi, Johnny Damon y Jason Isringhausen) y se encuentran sin dinero para sustituirlos. Los dueños, que compraron el equipo en 1995, mantienen desde entonces, por decirlo elegantemente, un presupuesto muy ajustado. Ante esa situación, Billy Beane se enfrenta a la inercia de sustituir a los CR7 del bate por jugadores similares. Pero, en vez de traerse a Hazard, por poner un ejemplo, Billy se presenta con Paul DePodesta, un licenciado en Harvard acostumbrado a ver el mundo a través de las rejillas de su Excel. Y ahí empieza todo.

El método que siguen es sencillo, lógico y muy arriesgado. Aquí el lector va a notar una ligera pendiente ascendente, pero creo que seguir el proceso merece la pena. Billy y Paul descubrieron que, para llegar a los playoffs, era necesario conseguir, al menos, 95 victorias (W) en la temporada. Crearon una nueva variable RD, definida como la diferencia entre las carreras anotadas (RS-Runs Scored) y las carreras concedidas (RA-Runs Allowed). Y con una sencilla regresión lineal (W=80.8814 + 0.1058 RD) llegaron a la conclusión de que necesitaban hacer 134 carreras más que las concedidas para llegar a los playoffs.

¿Y cómo obtener esas 134 carreras? Este es el punto en el que la realidad se bifurca. Como cuando en la N-III tienes que elegir entre Valencia y Alicante. Hasta entonces, por sentido común, se consideraba que la variable más importante para valorar a un jugador era su media de bateo (BA-Batting Average). Pero (si no fuera por este pero, no habría historia y Brad Pitt no habría hecho de Billy Beane en Moneyball) otra regresión lineal (que es al mundo del machine learning lo que el Baby Yoda al universo de Star Wars) descubre que hay dos variables más relevantes: la frecuencia con la que un jugador alcanza una base en su turno (OBP – On-Base Percentage) y el total de bases que un jugador consigue en su turno (SLG – Slugging percentage) para obtener el RS o carreras anotadas.

Esa es la revolución. OBP y SLG. Billy Beane se enfrenta a todo su equipo, entrenador incluido, al buscar jugadores que ofrezcan altos porcentajes en ambas variables. No le cuesta dar con ellos y pagar lo que piden porque ningún equipo les da valor. El OBP y el SLG eran como las cocochas hace muchos años: ahora muy valoradas pero entonces prácticamente las regalaban en el mercado. Para los interesados, ésta es la regresión: RS = -804,63 + 2737,77 OBP + 1584,91 SLG.

Llegados a este punto, la pendiente vuelve a disminuir, pero con una clara señal de spolier a ambos lados de la carretera porque hay que contar si el experimento salió bien. Quien quiera, puede marcharse a Netflix, ver la película, y volver después. Y el que decida aprovechar el paseo para hacer números puede hacer un alto en la página del MIT donde se desarrolla lo que aquí se ha resumido.

Y aquí va el spoiler: el experimento funcionó. Y muy bien. Los Oakland Athletics llegaron a los playoffs y lograron un récord al conseguir veinte victorias seguidas. La ciencia de datos había llegado para quedarse en el mundo del deporte. Los Red Sox implementaron modelos similares y ganaron las Series Mundiales por primera vez en 86 años. Y, si se compara el salario medio gastado por los equipos hasta 2002 con el de después, se ve que este ha bajado significativamente al aplicar modelos parecidos que recomendaban jugadores más baratos.

Desde entonces, es de suponer que este enfoque analítico se está aplicando en todos los deportes. En lo que se refiere al fútbol, parece que realizar modelos no es tan sencillo, pero es cuestión de tiempo que se dé con alguno consistente. Ya hay libros escritos sobre el tema, como The Numbers Game: Why Everything You Know about Football is Wrong, de Chris Anderson y David Sally, Football Hackers: The Science and Art of a Data Revolution, de Christoph Biermann o Soccernomics: Why England Lose, Why Germany, Spain and France Win, and Why One Day The Rest of the World will Finally Catch Up, de Simon Kuper y Stefan Szymanski.

Así que es bastante posible que muchas de las cosas que suceden en el mundo del fútbol y que resultan difíciles de entender sean el resultado de un algoritmo que todavía está aprendiendo, mirándose indeciso en el espejo del probador. Podemos pensar que los algoritmos jamás lograrán tener éxito, pero lo que no se nos dice es dónde están haciendo bien su trabajo (en la prevención de lesiones, por ejemplo) para saber el ritmo al que sigue avanzando la lengua de lava mientras el hielo de nuestro cubo se deshace.

Dejar respuesta

Please enter your comment!
Please enter your name here