Noticias

Usan Inteligencia Artificial para arreglar problemas de videollamadas

La nueva creación reduce el consumo de ancho de banda del streaming creando avatares de personas durante las conferencias online. Metro averigua qué hay detrás de esta tecnología de Inteligencia Artificial

Aunque la videoconferencia demostró ser una herramienta útil durante la cuarentena, los fallos de conexión siguen siendo un gran problema. Por eso NVIDIA desarrolló un proceso de Inteligencia Artificial llamado Maxine que, en lugar de transmitir video, sólo envía una imagen clave del orador además de los datos de seguimiento de la cara. Según la compañía, su creación permite hacer videollamadas con una décima parte del ancho de banda de la red que los usuarios suelen necesitar.

«Queremos proporcionar una mejor experiencia para las comunicaciones de vídeo con la IA, de modo que incluso las personas que sólo tienen acceso a un ancho de banda extremadamente bajo puedan pasar de las llamadas de voz a las de vídeo», explicó Arun Mallya, investigador de IA de NVIDIA.

Para lograrlo, la compañía utiliza la Generative Adversarial Network (GAN), que transmite las expresiones de los hablantes con sólo unos pocos puntos clave de la cara de una persona alrededor de los ojos, la boca y la nariz.

Recomendados

«Cuando se integra con otras funciones de Maxine, como Audio2Face, los usuarios pueden incluso animar personajes o avatares en función de lo que dicen y de cómo lo dicen», explica Siddharth Sharma, desarrollador de IA y responsable de marketing de productos en NVIDIA, a Metro.

La tecnología funciona incluso cuando las personas que llaman llevan sombrero, gafas, auriculares o máscara, ya que utiliza la red neural para alinear la posición de los rostros para una experiencia más natural.

«Con las técnicas de visión por ordenador, podemos localizar la cabeza de una persona en una amplia gama de ángulos, y creemos que esto ayudará a la gente a tener conversaciones más naturales», concluyó Ting-Chun Wang, otro investigador de IA de la compañía.

Metro habló con Siddharth Sharma para saber más.

ENTREVISTA

 

Siddharth Sharma,
El desarrollador de IA y el responsable de marketing de productos en NVIDIA

P: ¿Qué es Maxine y cómo funciona?
– Es una plataforma basada en la inteligencia artificial que los desarrolladores pueden utilizar para añadir nuevas características a las plataformas de videoconferencia. Las aplicaciones de videoconferencia basadas en Maxine pueden reducir significativamente el ancho de banda de vídeo utilizando la compresión de vídeo de IA, mejorando la calidad de vídeo para los usuarios con menor ancho de banda y reduciendo los costos para los proveedores de plataformas de videoconferencia.

P: Cuéntenos más sobre el uso de la Inteligencia Artificial.
– Maxine utiliza el aprendizaje profundo y la IA para ofrecer características como la alineación de la cara, la corrección de la mirada, la iluminación de la cara y la superresolución, además de capacidades basadas en el lenguaje como las traducciones en tiempo real, la eliminación del ruido, los subtítulos y los asistentes virtuales.
Algunas de las características, como la alineación de la cara y la corrección de la mirada, se basan en las GAN (Generative Adversarial Networks), mientras que características como el subtitulado cerrado, las traducciones en vivo y los asistentes virtuales utilizan tecnologías de IA conversacional, a menudo llamadas procesamiento del lenguaje natural.

P: ¿Qué le depara el futuro a esta tecnología?
– Hace poco que hemos presentado la plataforma NVIDIA Maxine, por lo que trabajaremos con los proveedores de aplicaciones de videoconferencia para seguir desarrollando las funciones que les gustaría añadir a sus servicios a medida que avancemos hacia la disponibilidad general del software Maxine.

Cuatro formas de mejorar la velocidad de tus videollamadas

Usar un cable de Ethernet
Si tienes la posibilidad de hacerlo, lo mejor es conectar el ordenador al router mediante un cable Ethernet. Esto proporciona una conexión mucho más estable a Internet que el Wi-Fi.

Mueve tu router
Si es imposible utilizar un cable Ethernet, intente reubicar el enrutador para que esté más cerca del ordenador o del dispositivo que utiliza para las videollamadas. También puedes usar una aplicación para identificar un lugar, donde la intensidad de la señal es mejor.

Desconecta los dispositivos no utilizados
El número de dispositivos conectados a WiFi también afecta a la calidad de la videoconferencia. Así que siempre es una buena idea desconectar otros aparatos que no estés usando.

Cierra todas las demás aplicaciones
Para tener una mejor velocidad de Internet durante la videollamada, también puedes desactivar todos los demás programas que se ejecutan en el equipo.

LAS CLAVES

Uso de datos durante las videollamadas:

La mayoría de las aplicaciones utilizan un mínimo de unos 500 kbps para las llamadas de definición estándar unidireccionales.

El máximo es de unos 1,8 Mbps para las videoconferencias de alta definición de una sola dirección.

Si es un flujo de dos vías: un total de 7,25 MB/minuto mínimo, 27 MB/minuto máximo.

En comparación, un minuto de video de 720p de YouTube típicamente consume de 20 a 30 megabytes.

Tags

Lo Último


Te recomendamos