La necesaria revisión constante del enfoque ético en torno a Big Data e inteligencia artificial

by Julen

La semana pasada comentaba el comienzo de las clases de Ética y Datos con las chicas y chicos de primero. Pues bien, mañana lo hacemos con el grupo de segundo curso. El curso pasado ya tuvimos contacto suficiente como para que comprendan de qué va todo esto. Cada uno de los retos que se les van planteando a lo largo del curso –cuatro en total– exige que en el informe final incorporen un apartado de implicaciones éticas y legales. Además, en las presentaciones ante los clientes también tendrán que explicarse. Las clases intentan ayudarles en la reflexión sobre cuáles pueden ser esas implicaciones.

En este segundo curso vamos a utilizar un modelo concreto de análisis: el Data Ethics Canvas, del que ya he escrito anteriormente. Esta propuesta surgió en 2017 y ha sido revisada recientemente a raíz del tsunami de la covid19. Detrás del enfoque se encuentra el Open Data Institute, una entidad que nació en 2012 y que tiene su sede en Londres. En su carta de presentación aparece nada más ni nada menos que el mismísimo sir Tim Berners-Lee, ahí es nada.

Creo que es importante que en clase se den en cuenta de que en la actualidad existe ya un cierto abanico de propuestas sistematizadas para analizar las implicaciones éticas del uso de los algortimos. Si he decidido centrarme en una de ellas es porque me interesa que seamos capaces de someterla a juicio crítico. Ya sabéis; es lo de siempre: aplicar un enfoque ético a estas herramientas que en principio nos ayudan a hacernos las preguntas adecuadas. Cuestión de aplicar a la ética a estos modelos éticos.

Sin embargo, uno de los grandes problemas es la celeridad con la que todo sucede en torno a las tecnologías. La capacidad de procesamiento continúa disparada y parece que vivimos ya en una sociedad en cuyo ADN se han quedado vivir los datos masivos. Es difícil contraargumentar porque muchos de los negocios de éxito tienen que ver con el uso intensivo del combustible del siglo XXI: los datos. Cuando todo cambia tan deprisa no es fácil fijar referencias válidas.

El Data Ethics Canvas fija la mirada en tres aspectos de los datos: la forma en que se recogen, cómo se usan y, finalmente, de qué manera se comparten. Hacerse preguntas siguiendo este camino (recogida – uso – compartición) ayuda a no olvidar preguntas relevantes. Según el reto en cuestión que estén abordando en clase algunas de las preguntas serán más pertinentes que otras, pero es importante disponer de un mapa que nos guíe a lo largo de todo el proceso.

Comentaba la semana pasada que buscamos desarrollar el pensamiento crítico en estas chicas y chicos que viven con entusiasmo su trabajo con los datos masivos. Con un modelo como el Data Ethics Canvas hay que continuar en la brecha: ¿qué nuevos inputs podemos incorporar al canvas?, ¿cuáles convendría repensar? Con la revisión de este año a cuenta de la covid19 ahora se presenta en cuatro grandes bloques de análisis (los podéis ver en el GIF animado al final de este post). Junto al canvas, se elaboró el año pasado una guía para facilitar el trabajo con un equipo a la hora de aplicarlo. El último de los bloques termina preguntándonos qué vamos a hacer. Me parece fundamental porque no se trata solo del análisis teórico, sino de qué acciones vamos a desplegar sobre el terreno para que la ética baje a la realidad y no se quede en grandes declaraciones de intenciones sin conexión con lo operativo.

Ya que vamos a utilizar este modelo, comparto aquí los apartados y las preguntas que se sugieren para analizar las implicaciones éticas del trabajo con datos masivos, algoritmos e inteligencia artificial. ¿Echas algo en falta?

  1. Fuentes de los datos
    • Name/describe key your project’s data sources, whether you’re collecting data yourself or accessing via third parties.
    • Is any personal data involved, or data that is otherwise sensitive?
  2. Derechos en torno a las fuentes de los datos
    • Where did you get the data from? Is it produced by an organisation or collected directly from individuals?
    • Was the data collected for this project or for another purpose? Do you have permission to use this data, or another basis on which you’re allowed? What ongoing rights will the data source have?
  3. Limitaciones respecto a las fuentes de los datos
    • Are there limitations that could influence your project’s outcomes?
    • Consider:
      • bias in data collection, inclusion/exclusion, analysis, algorithms
      • gaps or omissions in data
      • provenance and data quality
      • other issues affecting decisions, such as team composition
  4. Contexto ético y legislativo
    • What existing ethical codes apply to your sector or project? What legislation, policies, or other regulation shape how you use data? What requirements do they introduce?
    • Consider: the rule of law; human rights; data protection; IP and database rights; anti-discrimination laws; and data sharing, policies, regulation and ethics codes/frameworks specific to sectors (eg health, employment, taxation).
  5. Tus razones para usar los datos
    • What is your primary purpose for collecting and using data in this project?
    • What are your main use cases? What is your business model?
    • Are you making things better for society? How and for whom?
    • Are you replacing another product or service as a result of this project? 
  6. Efectos positivos en la gente
    • Which individuals, groups, demographics or organisations will be positively affected by this project? How?
    • How are you measuring and communicating positive impact? How could you increase it?
  7. Efectos negativos en la gente
    • Who could be negatively affected by this project?
    • Could the way that data is collected, used or shared cause harm or risk individuals being re-identified? Could it be used to target, profile or prejudice people, or unfairly restrict access (eg exclusive arrangements)?
    • How are limitations and risks communicated to people? Consider: people who the data is about, people impacted by its use and organisations using the data.
  8. Minimizando el impacto negativo
    • What steps can you take to minimise harm?
    • How could you reduce any limitations in your data sources? How are you keeping personal and other sensitive information secure?
    • How are you measuring, reporting and acting on potential negative impacts of your project?
    • What benefits will these actions bring to your project?
  9. Comprometiéndonos con gente
    • How can people engage with you about the project?
    • How can people correct information, appeal or request changes to the product/service? To what extent?
    • Are appeal mechanisms reasonable and well understood?
  10. La comunicación de nuestro propósito
    • Do people understand your purpose – especially people who the data is about or who are impacted by its use?
    • How have you been communicating your purpose? Has this communication been clear?
    • How are you ensuring more vulnerable individuals or groups understand?
  11. Apertura y transparencia
    • How open can you be about this project? Could you publish your methodology, metadata, datasets, code or impact measurements?
    • Can you ask peers for feedback on the project? How will you communicate it internally?
    • Will you publish your actions and answers to this canvas openly?
  12. Compartiendo los datos con otra gente
    • Are you going to be sharing data with other organisations? If so, who?
    • Are you planning to publish any of the data? Under what conditions?
  13. Implementación en curso
    • Are you routinely building in thoughts, ideas and considerations of people affected in your project? How?
    • What information or training might be needed to help people understand data issues?
    • Are systems, processes and resources available for responding to data issues that arise in the long-term?
  14. Revisiones e iteraciones
    • How will ongoing data ethics issues be measured, monitored, discussed and actioned?
    • How often will your responses to this canvas be reviewed or updated? When?
  15. Tu plan de acción
    • What actions will you take before moving forward with this project? Which should take priority?
    • Who will be responsible for these actions, and who must be involved?
    • Will you openly publish your actions and answers to this canvas?

Data Ethis Canvas vers2020

Imagen de la portada: Alejandro Piñero Amerio en Pixabay.

Artículos relacionados

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.