Móviles capaces de detectar objetos 3D en tiempo real: Google lo hace posible a través de su IA

Ricardo Aguilar

Uno de los puntos capitales en la investigación de Google esel análisis de imágenes. Las sugerencias automáticas deGoogle Fotoso las capacidades deGoogle Lensson buenos ejemplos, así como la reciente noticia de que la compañía ya tiene listasu nueva capa de análisis para entender qué hay presente en cada foto. Si vamos un poco más allá, a la detección de objetos como tal, Google también tiene algunos ases sobre la manga.

Google acaba de anunciar el lanzamiento de MediaPipe Objectron,su tecnología móvil para detección de objetos 3D en tiempo real, algo que permite al smartphone reconocer tamaño y orientación de un objeto, lo que abre varias puertas de aplicación.

Objectron es capaz de calcular cuadros 3D en tiempo real

MediaPipees el marco multiplataforma de Google para crear distintas canalizaciones de procesamiento de datos. Objetron se incluye dentro de dicho marco, comocanalización móvil para detección de objetos 3D en tiempo real.Grosso Modo, Objectron detecta objetos a través de imágenes 2D, para posteriormente estimar su orientación y tamaño a través de un modelo de aprendizaje automático entrenado en un conjunto de datos 3D. En otras palabras,es capaz de detectar objetos 3D a partir de una sola imagen RGB.

A nivel de estructura básica, el modelo tiene una arquitectura de codificador-descodificador basada enMobileNetV2, lasredes neuronales de Google para clasificación y detección visual. Mediante dichas redes, la proyección 2D de la imagen y un algoritmo de estimación 3D, el modelo es capaz de procesar una salida en 3D de dicho objeto.

Para mitigar las posible fluctuaciones en la imagen, Google ha trabajado bajo el mismo marco de detección y seguimiento para sus objetos 2D. Esto se traduce en algo que ya te sonará si sabes cómo trabaja Google:segmentación de imagen.

Google destaca que el modelo es tan ligero quepuede funcionar a tiempo real a 26 FPSen un móvil de gama alta, en concreto, con la Adreno 650 (la GPU del reciente Snapdragon 865). La nueva soluciónya está disponible para quien quiera probarla, con el fin de que se desarrollen nuevos casos de uso y aplicaciones.

Es relevante esta nueva propuesta, máxime teniendo en cuenta que a día de hoy hay potentes plataformas de realidad aumentada como AR Core en el caso de Google y AR Kit en lo que alude a Apple. Videojuegos, aplicaciones, fotografía, vídeo y demáspueden beneficiarse del reconocimiento de objetos.

Vía |Google

Disney+ rebajado de 69,99 euros a 59,99 euros durante un año: oferta limitada hasta el 23 de marzo