Simular que siempre miramos a cámara y reducir el ancho de banda un 90%: la nueva IA de Nvidia promete revolucionar las videollamadas
Enrique Pérez
Editor especializado en tecnología de consumo y sociedad de la información. Estudié física, pero desde hace más de diez años me dedico a escribir sobre tecnología, imagen y sonido, economía digital, legislación y protección de datos. Interesado en aquellos proyectos que buscan mejorar la sociedad y democratizar el acceso a la tecnología.LinkedIn
Maxine es la nueva plataforma de Nvidia y llega dispuesta a revolucionar las videollamadas. Se trata de un nuevo servicio en la nube que Nvidia ofrecerá a otros desarrolladores, donde mediante inteligencia artificial se incorporan una serie de efectos para mejorar las videollamadas. No hablamos de unos simples filtros de belleza, sino deaplicar el potencial de los deepfakes a las videollamadaspara incrementar “significativamente” su calidad, según explica la compañía.
Entre los curiosos efectos que promete Nvidia Maxine se encuentra la superresolución, la cancelación del ruido de fondo, iluminación facial, reducción del ancho de banda y hasta lacorrección de la mirada, para que parezca que siempre estamos mirando a cámara.
Nvidia Maxine: el nuevo objetivo de la IA es mejorar las videollamadas
Aprovechando la GTC 2020, Nvidia ha anunciado actualizaciones sobre cerca de 80 SDKs de su catálogo. Otra de las novedades es Maxine, un servicio para videollamadas que estádisponible en beta desde esta semana. Maxine aprovecha las ‘redes generativas antagónicas’, más conocidas sencillamente como GANs, para analizar la imagen de la videollamada y recrearla parcialmente con el objetivo de introducir una mejora.
Una de las primeras herramientas que ofrece Maxine es la de analizar el rostro de la persona y mediante algoritmos identificar los píxeles clave. Con esto, Maxine prometereducir hasta un 90% el ancho de banda de las videollamadas con el estándar H.264. Consiste en que en vez de emitir todos los píxeles, el servicio emite únicamente los puntos del rostro más importantes y el resto está recreado. En vez de intentar transmitir todos y cada uno de los píxeles, que en muchas ocasiones no ofrecen una imagen precisa, solo se transmite lo estrictamente necesario.
No es la primera vez que vemos una inteligencia artificial recreando el rostro de personas, puesen el pasadoya hemos visto a las GANs haciendo representaciones de lo más realistas, incluso partiendo de una base muy poco sólida como unsimple garabato.
Otra de las incorporaciones de Nvidia Maxine es la corrección de mirada. La IA identificar la alineación del rostro y lo ajusta automáticamente recreando las partes faltantes. Maxine promete incluso ser capaz desimular la mirada aunque la cámara no esté directamente enfrente del usuario.
La nueva plataforma de Nvidia añade otras correcciones como unamejora de la iluminación, reducción del ruido ambientaly en general una mejora de la resolución de las videollamadas. Por el momento se trata de una primera versión, pero Nvidia anticipa un futuro donde servicios de videollamadas comoGoogle MeetoZoompermitan automáticamente transmitir una imagen nuestra mejorada, gracias a la interpretación que hagan de nosotros los algoritmos.
Más información |NVIDIA