El robot funciona con el servicio AutoML Vision, perteneciente a la plataforma Google Cloud. (Foto: RedPepper Y Matt Reed, creadores del robot)
El robot funciona con el servicio AutoML Vision, perteneciente a la plataforma Google Cloud. (Foto: RedPepper Y Matt Reed, creadores del robot)
Redacción EC

La agencia creativa estadounidense RedPepper publicó hace un par de días, en su cuenta de , un video que muestra su más reciente creación: un brazo  capaz de encontrar, en tan solo unos cuantos segundos, a la famosa caricatura de suéter rojiblanco, Waldo, el popular personaje de los libros infantiles ¿Dónde está Waldo?

El robot There’s Waldo se compone de un brazo que está controlado por el hardware abierto Raspberry Pi, y una biblioteca de lenguaje de programación, PyARM Python. Al disponer los códigos en la biblioteca, el brazo mecánico tiene las indicaciones necesarias para responder a lo que se le pide.

Sin embargo, ese no es su mayor potencial. Su ‘habilidad’ se basa realmente en el mecanismo que tiene para encontrar al popular personaje: el machine learning o aprendizaje automatizado, técnica que tiene sus fundamentos en la inteligencia artificial y que logra que los computadores aprendan por medio de programas que generalizan comportamientos a partir de información presentada en forma de ejemplos.

¿Cómo funciona?

Una vez la máquina está funcionando, el brazo mecánico recibe órdenes para extenderse y hacer una captura fotográfica de la escena del libro que se le presenta. Los cuadros de ¿Dónde está Waldo? son imágenes conocidas por tener una multitud de personajes en un mismo espacio, lo cual dificulta la labor de encontrar al personaje principal.

Después de esto, el robot utiliza OpenCV, una biblioteca libre de visión artificial que le permite buscar y detectar rostros. Las caras se envían al servicio Google Auto ML Vision, allí se comparan cada uno de los rostros suministrados con el modelo de Waldo.

Para que la máquina logre reconocer la cara entre los cientos de personajes que se le parecen, usa un modelo probabilístico con información de cerca de 107 imágenes de Waldo a partir de un sistema de training vision, que puede tardar entre 15 minutos y varias horas.

De esta manera, There's Waldo logra hacer las predicciones, que cada vez son más acertadas y veloces, porque surgen a partir de nuevas imágenes que son enviadas a través de la nube de Google.

Si la máquina encuentra una coincidencia del 95 por ciento o superior, el brazo recibe automáticamente la instrucción de extenderse hacia las coordenadas donde está la cara correspondiente y señalarla; para ello, el brazo tiene dispuesta una mano de goma.

Si el robot reconoce varios Waldos en una misma escena, como suele presentarse en las últimas páginas del libro, este identificará a cada uno de ellos.

There’s Waldo es apenas un prototipo que está en constante aprendizaje y una sencilla muestra de las posibilidades del aprendizaje automatizado.

Hasta el momento, su mejor tiempo de búsqueda ha sido de 4,45 segundos, que, como indica su compañía creadora, RedPepper, “es mejor que lo logrado por la mayoría de los niños de cinco años”.

(El Tiempo)

LEE TAMBIÉN...

Contenido sugerido

Contenido GEC