Redacción 2 febrero, 2019
Diversity in Faces
Diversity in Faces
Diversity in Faces

IBM Research publica el conjunto de datos “Diversity in Faces” para avanzar en el estudio de la imparcialidad en los sistemas de reconocimiento facial

Diversity in Faces es la herramienta de equidad ciudadana para la Economía del Conocimiento. ¿Alguna vez ha sido tratado injustamente? ¿Cómo lo hizo sentir? Probablemente no sea demasiado bien.

La mayoría de las personas generalmente están de acuerdo en que un mundo más justo es un mundo mejor, y nuestros investigadores de AI no podrían estar más de acuerdo.

Es por eso que estamos aprovechando el poder de la ciencia para crear sistemas de inteligencia artificial que sean más justos y precisos.

Muchos de nuestros avances recientes en inteligencia artificial han producido capacidades extraordinarias para que las computadoras realicen tareas cada vez más sofisticadas e importantes, como traducir el habla a través de idiomas para unir las comunicaciones entre culturas, mejorar las interacciones complejas entre personas y máquinas, y reconocer automáticamente los contenidos de video para ayudar a la seguridad aplicaciones

Aprendizaje Profundo

Gran parte del poder de la IA hoy en día proviene del uso del aprendizaje profundo basado en datos para entrenar modelos cada vez más precisos mediante el uso de cantidades cada vez mayores de datos.

Sin embargo, la fuerza de estas técnicas también puede ser una debilidad. Los sistemas de inteligencia artificial aprenden lo que se les enseña, y si no se enseñan con conjuntos de datos sólidos y diversos, la precisión y la imparcialidad podrían estar en riesgo.

Por esa razón, IBM, junto con los desarrolladores de inteligencia artificial y la comunidad de investigación, deben tener en cuenta los datos que utilizamos para la capacitación. IBM mantiene su compromiso de desarrollar sistemas de inteligencia artificial para hacer que el mundo sea más justo.

Inteligencia Artificial

El desafío en el entrenamiento de la IA se manifiesta de manera muy evidente y profunda con la tecnología de reconocimiento facial. Hoy en día, puede haber dificultades para hacer sistemas de reconocimiento facial que cumplan con las expectativas de imparcialidad.

El núcleo del problema no está en la tecnología de la IA en sí, sino en cómo se entrenan los sistemas de reconocimiento facial impulsados ​​por la IA.

Para que los sistemas de reconocimiento facial funcionen como se desea, y los resultados sean cada vez más precisos, los datos de entrenamiento deben ser diversos y ofrecer una amplia cobertura.

Por ejemplo, los conjuntos de datos de entrenamiento deben ser lo suficientemente grandes y lo suficientemente diferentes como para que la tecnología aprenda todas las formas en que las caras difieren para reconocer con precisión esas diferencias en una variedad de situaciones.

Las imágenes deben reflejar la distribución de características en las caras que vemos en el mundo.

¿Cómo medimos y aseguramos la diversidad de rostros humanos?

Por un lado, estamos familiarizados con la forma en que las caras difieren según la edad, el género y el tono de la piel, y cómo las diferentes caras pueden variar en algunas de estas dimensiones.

Gran parte del enfoque en la tecnología de reconocimiento facial ha estado en cómo se desempeña dentro de estos atributos.

Pero, como han demostrado estudios anteriores, estos atributos son solo una pieza del rompecabezas y no son del todo adecuados para caracterizar la diversidad total de rostros humanos.

Las dimensiones como la simetría de la cara, el contraste facial, la postura en la que se encuentra la cara, la longitud o el ancho de los atributos de la cara (ojos, nariz, frente, etc.) también son importantes.

IBM Research

Ha lanzando un nuevo conjunto de datos grande y diverso llamado Diversity in Faces (DiF) para avanzar en el estudio de la imparcialidad y la precisión en la tecnología de reconocimiento facial.

El primero de su tipo disponible para la comunidad de investigación global, DiF proporciona un conjunto de datos de anotaciones de 1 millón de imágenes faciales humanas.

Usando imágenes públicamente disponibles del conjunto de datos de Creative Commons de YFCC-100M, anotamos las caras usando 10 esquemas de codificación bien establecidos e independientes de la literatura científica. [1-10]

Esquemas de codificación

Los esquemas de codificación incluyen principalmente medidas objetivas de rostros humanos, como características craneofaciales, así como anotaciones más subjetivas, como predicciones de edad y género etiquetadas por humanos.

Creemos que al extraer y liberar estas anotaciones del esquema de codificación facial en un gran conjunto de datos de 1 millón de imágenes de caras, aceleraremos el estudio de la diversidad y la cobertura de datos para los sistemas de reconocimiento facial de AI para garantizar que los sistemas de AI sean más justos y precisos.

El lanzamiento de hoy es simplemente el primer paso

Creemos que el conjunto de datos DiF y sus 10 esquemas de codificación ofrecen un punto de partida para los investigadores de todo el mundo que estudian la tecnología de reconocimiento facial.

Los 10 métodos de codificación facial incluyen craneofacial (p. Ej., Longitud de la cabeza, longitud de la nariz, altura de la frente), relaciones faciales (simetría), atributos visuales (edad, sexo) y postura y resolución, entre otros.

Estos esquemas son algunos de los más fuertes identificados por la literatura científica, construyendo una base sólida para nuestro conocimiento colectivo.

Nuestro análisis inicial ha demostrado que el conjunto de datos DiF proporciona una distribución más equilibrada y una cobertura más amplia de imágenes faciales en comparación con los conjuntos de datos anteriores.

Análisis Estadístico

Además, la información obtenida del análisis estadístico de los 10 esquemas de codificación iniciales en el conjunto de datos DiF ha fomentado nuestra propia comprensión de lo que es importante para caracterizar rostros humanos y nos ha permitido continuar la investigación importante sobre formas de mejorar la tecnología de reconocimiento facial.

El conjunto de datos está disponible hoy para la comunidad de investigación global a pedido.

IBM se enorgullece de tener esto disponible y nuestro objetivo es ayudar a promover nuestra investigación colectiva y contribuir a crear sistemas de inteligencia artificial que sean más justos.

Si bien IBM Research se compromete a continuar el estudio e investigación de sistemas de reconocimiento facial más justos, no creemos que podamos hacerlo solos.

Con el lanzamiento de hoy, instamos a otros a contribuir al creciente cuerpo de investigación y avanzar en esta importante agenda científica.

 

 

Por Marcelo Lozano – General Publisher IT CONNECT Latam

A %d blogueros les gusta esto: