Los datos son oro puro

Los datos son oro puro

La importancia de las grabaciones y el etiquetado para el desarrollo de la visión con Inteligencia Artificial

Una reciente publicación de Andrew NG * (uno de los pioneros más renombrados del Machine Learning) pone de manifiesto la importancia de los datos para el progreso de la Inteligencia Artificial (IA).

Como él mismo explica “A diferencia del software tradicional, que funciona con código, los sistemas de IA se construyen utilizando tanto código (incluyendo modelos y algoritmos) como con datos:

 

 

Mientras que los enfoques históricos solían tratar de mejorar el Código (ya sea la arquitectura del modelo o el algoritmo), ahora sabemos que “para muchas aplicaciones prácticas, es más eficaz centrarse en mejorar los Datos”.

Generar bases de datos más grandes y mejores suele ser la forma más directa de potenciar los resultados de la IA. El llamado “desarrollo de la IA centrado en los datos” está ganando terreno.

Para quienes, como nosotros en Sadako technologies, nos dedicamos a generar Redes Neuronales para aplicaciones de visión, construir conjuntos de datos de alta calidad, repetibles y sistemáticos, para garantizar un flujo de datos excelente y consistente a lo largo de todas las etapas de un proyecto es una actividad clave.

Nuestro proceso de generación de datos tiene dos pasos principales: la adquisición de imágenes y el etiquetado de estas.

Tomemos nuestro proyecto europeo HR-Recycler como caso de etiquetado. En este proyecto, SADAKO desarrolla sistemas de visión que necesitan reconocer los objetos RAEE (residuos de aparatos eléctricos y electrónicos) y sus componentes, así como los movimientos y gestos de los operarios de la planta de reciclaje.

Para la adquisición de imágenes, hemos preparado y realizado varias campañas de grabación en dos de los usuarios finales que participan en el proyecto: ECORESET e INDUMETAL. Las siguientes fotografías son imágenes tomadas en dichas campañas, las primeras corresponden a la detección de objetos y las últimas a la detección de gestos.

 

 

 

 

 

 

Se ha prestado especial atención a la elección del hardware, así como a replicar las condiciones ambientales (fondo, iluminación) lo más cerca posible de las que se encuentran en funcionamiento. En el caso de los conjuntos de datos de detección de movimiento humano, se han tenido muy en cuenta los aspectos que podrían generar posibles sesgos de género o edad en la recogida de datos, ya que éstos podrían perjudicar el rendimiento operativo de la red neuronal.

En cuanto al etiquetado, nuestro equipo interno de etiquetado, con la ayuda de herramientas de etiquetado propias, ha cumplido la tarea de generar múltiples anotaciones homogéneas de alta calidad para las diferentes categorías establecidas en los objetos RAEE y en los movimientos y gestos humanos.  Nuestro equipo de etiquetado es uno de los más cualificados y experimentados del mundo en el ámbito de los residuos, y toda nuestra tecnología se basa en su trabajo.

 

 

Unas grabaciones precisas y un etiquetado excelente garantizan la adecuada producción de algoritmos y son fundamentales para que el sistema de visión por IA funcione correctamente.

 

* https://www.deeplearning.ai/the-batch/issue-84/

Este artículo fue originalmente publicado en el Blog del HR-RECYCLER en junio de 2021.