Tras completar el Hackathon del #DFSDataChallenge23, se ha celebrado la #DFSDatathon23, la expedición o maratón de datos que completa el reto sobre derechos digitales y privacidad en los sistemas de reconocimiento facial.
Una datathon es una actividad formativa y colaborativa cuyo objetivo principal es trabajar alrededor de unos conjuntos de datos abiertos. En el caso de la datathon sobre identidad digital, privacidad, protección de datos y derechos digitales en reconocimiento facial, se trata de un evento colaborativo en el que los participantes se centran en la búsqueda de conjuntos de datos que ayuden en la puesta en marcha de sistemas de identificación biométricos seguros que respeten la privacidad de las personas de acuerdo con la legislación europea.
En este caso se trabaja con datos abiertos públicos que puedan ser utilizados en soluciones que utilicen la biometría como un elemento de autenticación unívoca.
Objetivo de la jornada
Generar un repositorio de conjuntos de datos para reconocimiento facial que permitan a empresas y desarrolladores poner aplicaciones y sistemas que sean totalmente respetuosas con el usuario. Este objetivo va alineado con la voluntad de seguir mejorando en la curación de datos biométricos en el uso de la inteligencia artificial para prevalecer la seguridad en los sistemas de reconocimiento facial.
Participantes
El repositorio resultado de la Datathon ha sido posible gracias a la participación y colaboración de las siguientes personas, expertas en reconocimiento facial o IA y daters con experiencia en la identificación, tratamiento, procesamiento y limpieza de datos:
- Álvaro Lluís Rodríguez es analista de datos en Holaluz.
- Ana Elizabeth Ledesma realiza visualización de datos en Médicos sin frontera
- Ana Garzón es profesora en la Universidad Oberta de Catalunya.
- Belen Arribas es abogada experta en Data Privacy.
- Cristina Diez es Directora de contenidos en Qnari.
- Didier Domínguez Herrera es Data Scientist en Fundació TIC Salut Social.
- Ferran Deitx Roca es responsable de analítica de datos en la Agència de Ciberseguretat de Catalunya.
- Gemma Romero Miguel es ingeniera Industrial.
- Gerard Guarin es estudiante en la UAB.
- Laura Martín González es analista de datos.
- Pablo Cerralbo es analista de datos en Holaluz.
- Paula Ruiz es ingeniera de datos.
- Pol Colomer Campoy es ingeniero informático.
Estas personas aparecen como coautoras en el informe de resultados. Su dedicación, entusiasmo y compromiso han sido fundamentales para el éxito del evento.
Dinámica de la jornada
Las personas participantes organizadas por equipos identifican por ronda fuentes de datos de diversas categorías que después son calificados por el resto (revisión de pares), para que de forma progresiva se genere un conjunto de datos final. Se definieron las siguientes 4 categorías:
- Imágenes faciales
- Características faciales
- Otros datos biométricos
- Patrones de movimiento
Finalmente, se obtuvo un total de 56 conjuntos de datos que se clasificaron en las cuatro categorías mencionadas anteriormente. Así mismo, también se validaron con respecto a los siguientes 12 factores éticos y legales: Consentimiento informado, anonimización, minimización de datos, seguridad y protección, retención limitada, transparencia, propósito legítimo, derechos de las personas afectadas, evaluación de impacto, sesgo y discriminación, igualdad de género y proporcionalidad.