El eyetracking o seguimiento ocular es un conjunto de tecnologías y metodologías que permiten registrar y medir los movimientos oculares y la posición de la mirada de una persona, proporcionando información objetiva sobre dónde, cuándo y durante cuánto tiempo dirige su atención visual [1,2]. Esta técnica se fundamenta en la estructura fisiológica del ojo humano: la fóvea, una pequeña depresión central en la retina de aproximadamente 1,5 mm de diámetro, es la zona de mayor agudeza visual y solo abarca unos 1–2 grados de ángulo visual. Para percibir el entorno con detalle, el ojo debe moverse constantemente, y el eyetracking captura precisamente esa dinámica [2].
Fundamentos fisiológicos y tipos de movimientos oculares
El ojo humano realiza varios tipos de movimientos que el eyetracking puede registrar [2,3]:
- Fijaciones: períodos (generalmente de 160 a 330 ms) durante los cuales la mirada se mantiene relativamente estable sobre un punto, permitiendo la captación de información visual detallada [2].
- Movimientos sacadicos: movimientos balísticos y rápidos (con velocidad máxima de hasta 600°/s) que desplazan la mirada de una fijación a otra. Durante las sacadas, la percepción visual se suprime (supresión sacádica), por lo que no se adquiere información útil en esos breves intervalos [2,5].
- Smooth pursuit (seguimiento suave): movimientos voluntarios que permiten seguir un objeto en movimiento con la mirada.
- Movimientos de vergencia: ajustes que acercan o separan los ojos para enfocar objetos a distintas distancias.
- Microsacadas y deriva: pequeños movimientos involuntarios que ocurren incluso durante las fijaciones [2].
Métodos de registro del eyetracking
A lo largo de la historia se han desarrollado diversos métodos para registrar los movimientos oculares [3]:
1. Electrooculografía (EOG)
Aprovecha la diferencia de potencial eléctrico entre la córnea (carga positiva) y la retina (carga negativa), de aproximadamente 0,4–10 mV. Se colocan electrodos en la piel alrededor de los ojos para detectar los cambios de potencial asociados al movimiento ocular. Es un método de bajo coste y alta resolución temporal, pero su precisión es limitada (error >1°) [3].
2. Método de reflexión corneal
Utiliza las características reflectantes de la córnea. Cuando una fuente de luz infrarroja ilumina el ojo, la córnea genera un reflejo (glint) cuya posición varía con el movimiento ocular. Al registrar este reflejo con una cámara, es posible inferir la dirección de la mirada. Es un método no invasivo y cómodo, aunque sensible a la humedad ocular y menos preciso para movimientos amplios [3].
3. Seguimiento basado en pupila-reflejo corneal (P-CR)
Es el método más utilizado en la actualidad. Emplea una o más cámaras y fuentes de luz infrarroja para capturar simultáneamente el centro de la pupila y el reflejo corneal (glint). La diferencia vectorial entre ambos puntos permite calcular la dirección de la mirada con alta precisión. Este método puede implementarse tanto en sistemas de sobremesa (remotos) como en dispositivos portátiles (gafas o cascos) [2,3].
4. Método de doble imagen de Purkinje (DPI)
Utiliza la primera y cuarta imágenes de Purkinje (reflejos de la superficie anterior de la córnea y de la superficie posterior del cristalino). La separación entre ambas imágenes permite medir la rotación ocular con alta precisión, independientemente de la traslación de la cabeza. Es uno de los métodos más precisos, pero requiere equipos costosos y condiciones de laboratorio exigentes [3].
5. Métodos basados en CNN y deep learning
En los últimos años, las redes neuronales convolucionales (CNN) y los transformadores visuales (Vision Transformers, ViTs) se han convertido en las técnicas predominantes para el eyetracking basado en visión artificial, permitiendo la estimación de la mirada incluso con cámaras RGB de bajo coste y en condiciones de iluminación variables. Las CNN ofrecen un buen equilibrio entre precisión y velocidad computacional, mientras que los ViTs logran mayor precisión a costa de mayores requerimientos de cómputo [5].
Tipos de dispositivos de eyetracking
Los sistemas actuales pueden clasificarse según su configuración [4]:
- Sistemas de sobremesa (remote/tower-mounted): el participante se sienta frente a una pantalla con cámaras infrarrojas integradas. Ofrecen alta precisión (hasta 0,5° de error) y altas tasas de muestreo (30–2000 Hz). Pueden ser con o sin restricción de cabeza (uso de mentonera) [2,4].
- Sistemas portátiles (wearable/head-mounted): integrados en gafas o cascos, permiten libertad de movimiento. Su precisión es menor (1–3° de error) y la tasa de muestreo suele ser más baja (50–120 Hz). Son ideales para estudios en entornos naturales [4].
- Sistemas integrados en realidad virtual (VR/AR): incorporan sensores de eyetracking dentro de visores de realidad virtual o aumentada, permitiendo renderizado foveado (foveated rendering) que reduce la carga computacional al renderizar con alta calidad solo la zona donde mira el usuario [1,7].
Medidas y métricas del eyetracking
Los datos de eyetracking pueden analizarse mediante diversas métricas [2,5]:
- Medidas temporales: duración de fijaciones, latencia de primera fijación, tiempo de permanencia (dwell time), duración de sacadas.
- Medidas espaciales: posición de las fijaciones, amplitud de las sacadas, trayectorias de exploración (scanpaths).
- Medidas de recuento: número de fijaciones, número de visitas a áreas de interés (AOIs), proporción de omisiones.
- Medidas de áreas de interés (AOIs/ROIs): tiempo total en una región específica, orden de exploración entre regiones.
- Mapas de saliencia: representaciones visuales que muestran las zonas más observadas mediante mapas de calor (heatmaps) [1,2].
Aplicaciones del eyetracking
Psicología y neurociencia
El eyetracking permite estudiar procesos cognitivos como la atención visual, la lectura, la percepción de escenas y el reconocimiento de rostros. Durante la lectura, las fijaciones duran aproximadamente 200–250 ms y las sacadas abarcan de 7 a 9 espacios de letra. Al aumentar la dificultad conceptual del texto, las fijaciones se alargan y las sacadas se acortan [1]. También se utiliza para investigar trastornos del neurodesarrollo como el autismo (TEA), el trastorno por déficit de atención (TDAH) y la dislexia [5,6].
Medicina
El eyetracking tiene aplicaciones diagnósticas en enfermedades neurodegenerativas (Alzheimer, Parkinson, esclerosis múltiple), trastornos psiquiátricos (esquizofrenia, trastorno bipolar) y lesiones cerebrales. Los patrones anómalos de movimientos sacádicos y de seguimiento suave son biomarcadores prometedores para la detección temprana de deterioro cognitivo leve [6]. También se utiliza en radiología para analizar cómo los expertos exploran imágenes médicas y mejorar la formación de profesionales sanitarios [6].
Interacción persona-ordenador (HCI)
El eyetracking permite interfaces controladas por la mirada, fundamentales para personas con discapacidades motoras severas (por ejemplo, sistemas de escritura ocular o eye typing). También se usa para evaluar la usabilidad de sitios web, aplicaciones y productos, identificando qué elementos atraen la atención del usuario [1,5].
Marketing y publicidad
Los estudios de eyetracking revelan qué elementos visuales (imágenes, texto, logotipos, colores) captan la atención del consumidor en anuncios impresos, digitales y empaques de productos, permitiendo optimizar diseños publicitarios [1].
Conducción y aviación
El eyetracking se emplea para monitorizar la atención del conductor/piloto, detectar fatiga o somnolencia, y analizar cómo los expertos distribuyen su atención visual en cabinas de mando o simuladores de vuelo [1,5].
Realidad virtual y aumentada (VR/AR)
En entornos inmersivos, el eyetracking permite el renderizado foveado (ahorro computacional), la interacción natural con objetos virtuales mediante la mirada, y el estudio de la atención, cognición y afecto del usuario durante tareas de aprendizaje y rendimiento en espacios tridimensionales [7].
Calidad de datos y buenas prácticas
Para garantizar la validez de los estudios de eyetracking, es crucial considerar [2]:
- Calibración: proceso en el que el participante mira una serie de puntos conocidos en la pantalla para establecer la correspondencia entre las coordenadas oculares y las de la escena. Una calibración deficiente es la principal fuente de error.
- Precisión y exactitud: la precisión se refiere a la consistencia de las medidas (error variable), mientras que la exactitud se refiere a la cercanía entre la posición medida y la real (error sistemático).
- Control de variables: factores como el tamaño, complejidad, saliencia y significado de los estímulos influyen en los movimientos oculares y deben controlarse cuidadosamente.
- Prerregistro (preregistration): dada la gran cantidad de medidas que pueden extraerse de los datos de eyetracking, se recomienda preregistrar las hipótesis y el plan de análisis para evitar el «fishing» (búsqueda oportunista de resultados significativos) [2].
Limitaciones actuales y direcciones futuras
A pesar de los avances, el eyetracking enfrenta varios desafíos [5]:
- Coste: los dispositivos de alta gama siguen siendo caros, aunque las alternativas de bajo coste (cámaras RGB webcam) están mejorando rápidamente gracias al deep learning.
- Calidad con dispositivos de bajo coste: la iluminación variable, la baja resolución de imagen y la necesidad de calibración frecuente limitan la precisión.
- Privacidad de datos: el uso de imágenes faciales plantea desafíos éticos y legales, especialmente en aplicaciones médicas y con poblaciones vulnerables.
- Falta de métricas unificadas: la heterogeneidad de las métricas utilizadas en la literatura dificulta la comparación entre distintos algoritmos y sistemas [5].
Las líneas futuras de investigación incluyen: el desarrollo de arquitecturas ligeras (como los Swin Transformers) que equilibren precisión y velocidad; la generación sintética de datos mediante modelos 3D o inteligencia artificial generativa para aumentar los conjuntos de datos disponibles respetando la privacidad; la integración del eyetracking con otras modalidades (EEG, fMRI) para obtener una visión más completa de los procesos cognitivos; y la implementación de sistemas descentralizados mediante computación en la nube y en el borde (edge computing) para aplicaciones en tiempo real [2,5].
Referencias