El algoritmo que te pondrá la nota en la universidad (II)

by Julen

Creo que este asunto de evaluar a nuestras alumnas y alumnos mediante algoritmos me va a hacer tirar de unos cuantos hilos. La madeja, no cabe duda, está muy enredada. No es fácil encontrar claridad, más allá de que la lógica nos diga que algoritmos y humanos deberían complementarse. Ahora bien, ¿colocamos ambas partes en la misma balanza? Bueno, a fin de cuentas, los algoritmos los diseñan los humanos, aunque luego el deep learning puede provocar eso que ya ha ocurrido en más de una ocasión: los humanos no entendemos por qué los algoritmos deciden lo que dicen. Y ahí, por supuesto, se rompe la baraja.

En este post quería detenerme en un ámbito muy concreto por si puede ayudarnos a mover las neuronas con criterio: la valoración en el baloncesto. Antes de nada, debo decir mi aproximación es desde mi responsabilidad en el ámbito de ética en nuestro grado de Business Data Analytics de Mondragon Unibertsitatea. Es decir, para nada soy experto en algo tan específico como la analítica masiva de datos en baloncesto. Y menos aún en este deporte en sí. Para eso está, como no, el colega Juanjo Brizuela 😉

La tradición de la analítica masiva de datos en el baloncesto viene de lejos. En la actualidad, desde la perspectiva académica, hay que decir que hasta existen cursos expertos en la materia, como el de la Universidad de Murcia, con nada más y nada menos que 60 créditos ECTS en su programa y la colaboración de NBN23. Aquí, en este artículo, nos centramos en un aspecto específico: la valoración de una jugadora o jugador profesional. Y sí, hay artículo en la Wikipedia. Hasta ahí hemos llegado.

Como seguramente habrás adivinado, si nos vamos, por ejemplo, a la NBA o a las competiciones europeas, todo tiene que ver con fórmulas matemáticas. A mí la primera cosa que me llama la atención es que no se emplea una única fórmula. Es decir, sin meterme demasiado en el asunto, no parece haber acuerdo en que haya un único algoritmo. Bueno, tampoco hay que volverse loco. Tomamos la idea de algoritmo como concepto; aquí de lo que se habla es de sumas, restas, multiplicaciones y divisiones, según parece. Más o menos complicadas, vale, pero las fórmulas, en el caso NBA, con la Eficiencia individual de los jugadores (EFF), o en Europa con el Performance Index Rating (PIR), tampoco parecen muy complejas. Para que te hagas una idea, este último número, el PIR, se calcula así:

(Puntos + Rebotes + Asistencias + Robos + Tapones + Faltas Recibidas) – (Tiros de Campo Fallados + Tiros Libres Fallados + Pérdidas + Tapones Recibidos + Faltas Realizadas)

Otra cosa es el PER, el Player efficiency rating, creado por el estadista deportivo John Hollinger. Este índice, que también se emplea en la NBA, sugiere una fórmula mucho más complicada, si bien luego también se generó una versión simplificada.

PTS + 0.4 * FG – 0.7 * FGA – 0.4*(FTA – FT) + 0.7 * ORB + 0.3 * DRB + STL + 0.7 * AST + 0.7 * BLK – 0.4 * PF – TOV

Me da que, en la medida en que todo esto viene de hace un montón de años, de alguna manera conforma el statu quo. Es decir, lo normal es valorar a quien juega por esos números. Y nadie se escandaliza. Lo que no quiere decir que no haya críticas continuas. Es lo que hay.

Eso sí, cuando profundizas un poco —solo un poco— en la materia, descubres que las variables que se pueden emplear llegan a sobrepasar de largo las 200. Si te gusta el asunto de las estadísticas en baloncesto, te recomiendo que eches un vistazo a la tabla comparativa que Jose A. Martínez, de la Facultad de Ciencias de la Empresa de la Universidad Politécnica de Cartagena, ha publicado en un paper académico: Una revisión de los sistemas de valoración de jugadores de baloncesto (I). La tabla de la página 8 a la 26. Ojo, se te pueden hacer los ojos txibiritas.

¿Podríamos llegar a un acuerdo en el caso del alumnado? Habría que resolver tres cuestiones: qué variables elegimos (la lista sería tan larga o más que en el baloncesto, me temo), cuánto de medibles objetivamente son y cómo ponderan. ¿Es más compleja la evaluación de alguien que estudia en la universidad o de alguien que juega a baloncesto en la NBA? Por supuesto, conocida la fórmula —sobre todo si cada variable pondera de forma diferente—, se activa su repercusión en la conducta: los humanos comienzan a comportarse de acuerdo con aquello por lo que se los mide. Más sencillo: dime cómo me mides y te diré cómo me comporto.

Cada jugadora o jugador ha recibido una valoración «objetivada». Las partes implicadas conocen las reglas del juego. Saben qué variables intervienen. La tentación es evidente: bajar solo al terreno de lo medible. Las variables que se pueden medir con un consenso amplio serán bienvenidas. ¿Qué pasa con las que son más difíciles de medir? Me da que pueden intervenir, al menos, dos sesgos:

  • La heurística de disponibilidad: damos más valor a la información de la que disponemos o podemos disponer. Si algo es difícil de conseguir (medir bien una determinada característica), terminamos por desecharlo.
  • El empleo de variables proxy: creemos que, al no disponer de una medición fácil de una variable, podemos emplear otras en su lugar, como si fueran esa que no hemos podido incorporar a nuestro algoritmo.

El empleo de estadísticas de valoración de jugadores podría hacer pensar en la existencia de una especie de «sistema experto». Con él a pleno rendimiento se podría eliminar al humano de la ecuación para decidir. Me da que nada más lejos de la realidad. ¿A quién elegir y por qué?, ¿todos los equipos querrían a los jugadores mejor valorados?, ¿no deberían los jugadores de un equipo «complementarse» para sumar capacidades?, ¿buscamos especialistas o polivalentes?

Esto último me hace pensar, por ejemplo, en qué refleja realmente la «nota académica». Porque es evidente que la persona, cada alumna y cada alumno, es más que la nota académica. Aun así, ¿la «nota académica» debería diseñarse como una única vara de medir, al margen de cómo es cada persona? Todo tiene que ver con lo que entendemos que entra dentro de la «nota académica». En el momento en que la concebimos como algo que va más allá de la adquisición de determinados conocimientos, ya la tenemos liada. Y conste que todo depende, también, de qué entendamos por conocimiento. Vaya lío…

 

Artículos relacionados

1 comentario

Juanjo Brizuela 22/10/2022 - 09:12

¡ Presente !
Lo poco que indagué, y que suelo revisar con frecuencia, sobre la analítica en baloncesto ha sido muy interesante. Tanto que concretamente tuvimos que recurrir a un recién licenciado en matemáticas para entenderlo bien y sobre todo pedirle que lo que en realidad queríamos no era tanto la valoración porque eso no nos daba margen de mejora inmediata, que era lo que buscábamos, sino tratar de predecir posibles futuros comportamientos o al menos cómo llegar a ellos.
Así que no es solo valorar, que por lo que te leo tiene una amplia gama de matices, los resultados, sino creo que también tratar de ver con antelación cuáles son los factores clave para mejorar esos resultados.
Y aquí me parece que hay mucha tela aún que cortar.
Y de los sesgos para ponderar datos ni te cuento.
O al menos eso creo.
Gracias por abrir el «mapa», Julen

Responder

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.