Sesgos estadísticos y sesgos cognitivos, una combinación diabólica

by Julen

En una sociedad en la que cada vez más la «verdad» se descarga en la ciencia de datos conviene levantar las alertas frente a algoritmos. Esto porque ni los datos están exentos de ideología ni la propia elaboración de los algoritmos (en la medida en que haya humanos de por medio) lo está. Además, si se trata, como casi siempre, de artimañas para vender más, las empresas –GAFAM o de cualquier otro tipo, ya todas participan de la misma guerra– no se andan con tonterías. Si la forma en que se nos presentan los datos y la forma en que trabajan los algoritmos sirven para incrementar la cifra de facturación, no tengas duda alguna: van a ir a saco. Corrijo: «están yendo ya a saco».

Por simplificar desde dónde pueden venir problemas, podríamos decir que pueden radicar en los datos mismos o en lo que sucede cuando se está trabajando con ellos o luego de haberlos trabajado, cuando ya se nos presentan en forma de algoritmos que deciden sobre tal o cual cosa. Con mediación humana o sin ella. Y de todo hay.

Pongamos primero un poco de orden en los conceptos.

Sesgo

El sesgo es un peso desproporcionado a favor o en contra de una cosa, persona o grupo en comparación con otra, generalmente de una manera que se considera injusta. (Fuente: Wikipedia).

Sesgo estadístico

Es un término usado para describir estadísticas que no proporcionan una representación precisa de la población. Algunos datos son erróneos porque la muestra de personas encuestadas no representa con precisión a la población. Otros datos pueden ser erróneos porque se omitieron demasiadas variables, lo que puede afectar a la precisión de los datos al final. (Fuente: Mailchimp).

Sesgo cognitivo

Sesgo cognitivo, prejuicio cognitivo o predisposición cognitiva son expresiones usadas para describir alteraciones en la mente humana que son moderadamente difíciles de eliminar y que llevan a una distorsión de la percepción, a una distorsión cognitiva, a un juicio impreciso o a una interpretación ilógica. (Fuente: Wikipedia).

Nos quedamos con algunos detalles:

  • Un sesgo supone, casi siempre, injusticia. Es el principio de todo y la razón por la que tenemos que prestar atención.
  • El sesgo estadístico puede provenir de datos no adecuados (en calidad o cantidad). Pero resulta que los datos son, siempre, siempre, siempre, del pasado. ¿El pasado es de donde vamos a aprender para reproducir lo que allí sucedía? ¿El algoritmo sigue al pasado y lo hace perdurar?
  • El sesgo estadístico puede omitir variables significativas porque muchas veces la realidad no se puede aprehender tan fácilmente. Hay muchas variables complejas que se hacen aflorar a través de variables proxy, pero ¿estas variables proxy sirven para explicar la complejidad?
  • Los sesgos cognitivos juegan en la liga del sistema 1 de Daniel Kahneman. De entre las características de esta forma de pensar hay una muy delicada, que tiene que ver con que nos volvemos «automáticos». Cuando las cosas van deprisa (algo consustancial a nuestro tiempo), el automatismo salta. Y ahí los sesgos cognitivos hacen su agosto y nos la cuelan, ¡vaya si nos la cuelan!

Cuando digo que la suma de sesgos estadísticos y cognitivos es «diabólica» me refiero a que el riesgo de tomar malas decisiones es impresionante. De ahí, cómo no, que la mejor medicina sean conceptos asociados a la ética de la inteligencia artificial: algoritmos explicables, auditables, transparentes… Nos jugamos demasiado en este envite, ¿no te parece? Y sí, cada vez estoy más convencido de que mejores algoritmos nos hacen mejor sociedad. No se trata de demonizarlos, solo de garantizar que hacemos las cosas bien.

Imagen de u_yzoxh6dzpy en Pixabay.

Artículos relacionados

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.