Conceptos de detección de rostro

Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

La detección de rostro permite encontrar rostros humanos en medios visuales, como imágenes digitales o videos. Cuando se detecta un rostro, tiene una posición, un tamaño y una orientación asociados. Además, se puede buscar puntos de referencia como los ojos y la nariz.

Estos son algunos de los términos que usamos con respecto a la función de detección de rostro del Kit de AA:

  • El seguimiento de rostros extiende la detección a secuencias de video. Se puede hacer un seguimiento de cada rostro que aparece en un video durante cualquier período de un fotograma a otro. Esto significa que un rostro detectado en fotogramas de video consecutivos puede identificarse como la misma persona. Ten en cuenta que esto no es una forma de reconocimiento de rostros; el seguimiento de rostros solo hace inferencias basadas en la posición y el movimiento de los rostros en una secuencia de video.

  • Un punto de referencia es un lugar de interés en un rostro. El ojo izquierdo, el ojo derecho y la base de la nariz son ejemplos de puntos de referencia. El Kit de AA permite buscar puntos de referencia en un rostro detectado.

  • Un contorno es un conjunto de puntos que siguen la forma de un rasgo facial. El Kit de AA permite encontrar los contornos de un rostro.

  • La clasificación determina si se encuentra alguna característica facial. Por ejemplo, un rostro se puede clasificar según si tiene los ojos abiertos o cerrados, o si está sonriendo o no.

Orientación del rostro

Los siguientes términos describen el ángulo al que se orienta un rostro con respecto a la cámara:

  • Euler X: Un rostro con un ángulo de Euler X positivo mira hacia arriba.
  • Euler Y: Un rostro con un ángulo de Euler Y positivo mira a la derecha de la cámara o a la izquierda si es negativo.
  • Euler Z: Un rostro con un ángulo de Euler Z positivo se encuentra girado contra las manecillas del reloj respecto de la cámara.

El Kit de AA no informa el ángulo de Euler X, Euler Y ni Euler Z de un rostro detectado cuando se configuran LANDMARK_MODE_NONE, CONTOUR_MODE_ALL, CLASSIFICATION_MODE_NONE y PERFORMANCE_MODE_FAST.

Landmarks

Un punto de referencia es un punto de interés en un rostro. El ojo izquierdo, el ojo derecho y la base de la nariz son ejemplos de puntos de referencia.

El Kit de AA detecta rostros sin buscar puntos de referencia. La detección de puntos de referencia es un paso opcional que está inhabilitado de forma predeterminada.

En la siguiente tabla, se resumen todos los puntos de referencia que se pueden detectar debido al ángulo de Euler Y de un rostro asociado:

Ángulo Euler Y Puntos de referencia detectables
- 36 grados ojo izquierdo, costado izquierdo de la boca, oreja izquierda, base de la nariz, mejilla izquierda
De -36 a -12 grados boca izquierda, base de la nariz, base de la boca, ojo derecho, ojo izquierdo, mejilla izquierda, punta de la oreja izquierda
De -12 a 12 grados ojo derecho, ojo izquierdo, base de la nariz, mejilla izquierda, mejilla derecha, costado izquierdo de la boca, boca derecha, boca inferior
De 12 a 36 grados costado derecho de la boca, base de la nariz, base de la boca, ojo izquierdo, ojo derecho, mejilla derecha, punta de la oreja derecha
> 36 grados ojo derecho, boca derecha, oreja derecha, base de la nariz, mejilla derecha

Cada punto de referencia detectado incluye su posición asociada en la imagen.

Contornos

Un contorno es un conjunto de puntos que representan la forma de un rasgo facial. En la siguiente imagen, se ilustra cómo se asignan estos puntos a un rostro. Haz clic en la imagen para ampliarla:

El contorno de cada característica que detecta el Kit de AA se representa con una cantidad fija de puntos:

Óvalo de rostro 36 puntos Labio superior (parte superior) 11 puntos
Ceja izquierda (parte superior) 5 puntos Labio superior (parte inferior) 9 puntos
Ceja izquierda (parte inferior) 5 puntos Labio inferior (parte superior) 9 puntos
Ceja derecha (parte superior) 5 puntos Labio inferior (parte inferior) 9 puntos
Ceja derecha (parte inferior) 5 puntos Puente nasal 2 puntos
Ojo izquierdo 16 puntos Parte inferior de la nariz 3 puntos
Ojo derecho 16 puntos
Mejilla izquierda (centro) 1 punto
Mejilla derecha (centro) 1 punto

Cuando se obtienen todos los contornos de un rostro a la vez, se obtiene un arreglo de 133 puntos, que se asignan a los contornos de las características como se muestra a continuación:

Índices de contornos de características
0-35 Óvalo de rostro
36-40 Ceja izquierda (parte superior)
41-45 Ceja izquierda (parte inferior)
46-50 Ceja derecha (parte superior)
51-55 Ceja derecha (parte inferior)
56-71 Ojo izquierdo
72-87 Ojo derecho
88-96 Labio superior (parte inferior)
97-105 Labio inferior (parte superior)
106-116 Labio superior (parte superior)
117-125 Labio inferior (parte inferior)
126 x 127 Puente nasal
128-130 Parte inferior de la nariz (ten en cuenta que el punto central está en el índice 128)
131 Mejilla izquierda (centro)
132 Mejilla derecha (centro)

Clasificación

La clasificación determina si se encuentra alguna característica facial. Actualmente, el Kit de AA admite dos clasificaciones: ojos abiertos y sonriendo.

La clasificación es un valor de certeza. Indica la confianza de que hay una característica facial. Por ejemplo, un valor de 0.7 o más para la clasificación de sonrisa indica que es probable que una persona esté sonriendo.

Ambas clasificaciones se basan en la detección de puntos de referencia.

Ten en cuenta también que las clasificaciones "ojos abiertos" y "sonrisa" solo funcionan para rostros frontales, es decir, rostros con un ángulo de Euler Y pequeño (entre -18 y 18 grados).

Tamaño mínimo del rostro

El tamaño mínimo del rostro, que se expresa como la proporción entre el ancho de la cabeza y el ancho de la imagen. Por ejemplo, el valor de 0.1 significa que el rostro más pequeño que se buscará ocupará aproximadamente el 10% del ancho de la imagen en la que se busca.

El tamaño mínimo del rostro es una compensación entre rendimiento y precisión: configurar el tamaño mínimo más pequeño permite que el detector encuentre rostros más pequeños, pero la detección tardará más tiempo. Si se configura más grande, es posible que se excluyan los rostros más pequeños, pero se ejecutarán más rápido.

El tamaño mínimo del rostro no es un límite estricto; el detector puede encontrar rostros un poco más pequeños de lo especificado.

Próximos pasos

Usa la detección de rostro en tu app para iOS o Android: