Gaming Club
Regístrate
españaESPAÑAméxicoMÉXICOusaUSA
Betech (temporal)
Ciencia y tecnología

INTELIGENCIA ARTIFICIAL

Google ya es capaz de leer los labios

La IA del buscador ya iguala casi la pericia humana en esta técnica.

Actualizado a
Google ya es capaz de leer los labios

Para una persona sorda, leer los labios de quien está frente suya hablándole y/o utilizando el lenguaje de signos es un refuerzo de cara a entender lo que quiere decirle. Y en sí es una habilidad que requiere de destreza y práctica, la misma que varios grupos de expertos están intentando enseñar a diversos programas informáticos para que aprendan a leer los labios de una persona y comprender qué está diciendo esta.

Google ya es capaz de leer los labios

Pero si alguno anda pensando ya en Hal 9000 y esa secuencia en 2001, Una Odisea del Espacio en la que la computadora lee los labios de los astronautas, señalarles que esa pericia informática aún queda algo lejos, aunque puede que no tanto. Este año un grupo de investigadores crearon el programa LipNet, un software capaz de conseguir un 93,4% de acierto leyendo los labios de varios sujetos. Impresionante teniendo en cuenta que el acierto humano en esta técnica es de sólo el 52,3%. Pero eso sí, LipNet sólo funcionaba con un material grabado a tal fin y una serie de voluntarios diciendo frases cortas y preparadas.

En este terreno entra de lleno DeepMind, la división IA de Google, cuyos expertos han conseguido crear mediante el uso de inteligencia artificial el software de lectura de labios más exacto del momento. Un programa que ha sido entrenado por científicos usando miles de horas de series y shows británicos de la BBC, alcanzando un impresionante 46,8% de exactitud de lectura que lo sitúan menos de 6 puntos por debajo del grado de acierto de un ser humano leyendo los labios. En una comparativa que muestra la perfección del software creado y la IA de Google, un lector profesional de labios sólo consiguió un acierto del 12,4% viendo los mismos shows que la IA.

En Siri o Alexa

Sabiendo discernir entre las 118.000 frases distintas y las 17.500 palabras únicas que las 5.000 horas de programación BBC le suministró, el software llamado “Watch, Listen, Attend and Spell” es susceptible de ser adaptado en un futuro en varias aplicaciones, como ayudar a los sordos a entender a otras personas.

El material de la BBC con el que la IA de Google ha sido entrenada
Ampliar
El material de la BBC con el que la IA de Google ha sido entrenada

De hecho podría utilizar en los cines o incluso en asistentes virtuales actuales como Siri o Alexa, que registrarían lo que diríamos simplemente con hablarles a la cámara del smartphone. Por descontado aún queda camino por recorrer, pero el hecho es que la IA de DeepMind está alcanzando de nuevo a la inteligencia humana.