PRUEBAS DE SEGUIMIENTO OCULAR

PARA EL ANÁLISIS DE LA IMAGEN


EYE TRACKING TESTS FOR

IMAGE ANALYSIS




Eréndida Cristina Mancilla González

Universidad Autónoma de San Luis Potosí

México

erendida@fh.uaslp.mx

http://orcid.org/0000-0002-0626-4440





Fecha de recepción: 05 de octubre, 2022. Aceptación: 20 de noviembre, 2022.













Resumen


El objetivo de este escrito consiste en presentar tres casos de investigaciones de percepción visual de la imagen, realizadas en la Universidad Autónoma de San Luis Potosí, mediante el uso del Eye Tracking. Se abordó el análisis del proceso de percepción visual del color en una imagen, cuya finalidad fue registrar y medir la forma en la que el ojo reacciona ante un estímulo de color; el análisis de la Saliencia de una imagen, con el propósito de determinar las zonas que sobresalen en la composición, mediante la obtención de un patrón de exploración y el trabajo perceptual realizado; y finalmente, el análisis de la simplicidad y complejidad de la imagen. En el estudio del comportamiento del ojo frente a un estímulo visual organizado, se monitoreó el proceso perceptivo de la imagen mediante el número de fijaciones realizadas, las rutas de exploración y la duración de la mirada fija en un área de interés. Las investigaciones se enfocan principalmente en la recopilación y el análisis de los datos cuantitativos (fijaciones -fx-, tiempo de duración -ms-) y las gráficas (mapas de calor, trazado de rutas) obtenidas en las pruebas de seguimiento ocular que arroja el Eye Tracking. Se describen los planteamientos de los experimentos y su estructuración (método) y los resultados a los que se llegó en cada caso, para ejemplificar cómo se percibe una imagen, atendiendo, según sea el caso, a su grado de complejidad, al uso del color y a sus áreas de Saliencia.



Palabras clave

Percepción visual, seguimiento ocular, imagen, color, saliencia.






Abstract


The objective of this paper was to present three cases of investigations of visual perception of the image, carried out at the Autonomous University of San Luis Potosi, through the use of Eye Tracking. The analysis of the process of visual perception of color in an image was addressed, whose purpose was to record and measure how the eye reacts to a color stimulus. The analysis of the Saliency of an image to determine the areas that stand out in the composition by obtaining an exploration pattern and the perceptual work carried out; and finally, the analysis of the simplicity and complexity of the image. In the study of the behavior of the eye in the face of an organized visual stimulus, the perceptual process of the image was monitored through the number of fixations made, the paths of exploration, and the duration of the gaze fixed on an area of interest. The investigations focus mainly on the collection and analysis of quantitative data (fixations -fx-, duration time -ms-) and graphs (heatmaps, scanpaths) obtained in the eye tracking tests that Eye Tracking throws. The approaches of the experiments and their structuring (method) and the results reached in each case are described, to exemplify how an image is perceived, attending, as the case may be, to its degree of complexity, the use of color, and their areas of Saliency.



Keywords


Visual perception, eye tracking, image, color, saliency.



Introducción


La Facultad del Hábitat de la Universidad Autónoma de San Luis Potosí ha puesto en funcionamiento el Laboratorio de Experimentación Multimedia (LEM), espacio que cuenta con aparatos y software especializado para la realización de pruebas de seguimiento ocular. Este laboratorio ha permitido llevar a experimentación principios relacionados con la composición de la imagen como son: el color, la estructura, el equilibrio, etc. Esto ha servido para poner a prueba los postulados que giran en torno a los fundamentos teóricos del diseño gráfico. La finalidad primordial de la experimentación perceptual consiste en detectar en qué punto de la imagen el sujeto fija la mirada, así como el tiempo en que lo hace, además de las rutas de exploración que emplea, según su estructura y composición.

Los experimentos comienzan con una prueba de calibración y análisis de visión, para un rango de agudeza visual entre 20/30 y 20/20. El sujeto debe permanecer frente al Eye Tracking, sin mover la cabeza, solamente los ojos, para que el aparato pueda detectarlo en todo momento; posteriormente, se presenta ante él una imagen de control, la cual es una lámina blanca con un punto al centro de la pantalla, con la finalidad de situar el inicio de la exploración de todos los sujetos al centro de la imagen. Posteriormente, se presenta al sujeto la imagen seleccionada como estímulo, con un tiempo de duración de la exploración visual entre 5 y 10 segundos (5000 ms y 10,000 ms). Para realizar el mapeo de datos, con la participación de usuarios, se separa a la imagen por zonas o áreas de interés, atendiendo a la composición y a sus ejes principales.

Los resultados se visualizan a partir del empleo de mapas de calor, en los que se pueden observar los elementos de la imagen que generan un mayor impacto visual en los usuarios. Mediante el empleo de los colores cálidos (rojo, naranja y amarillo), se registran las zonas de mayor interés; adicionalmente se cuenta con los trazados de las rutas sacádicas, en donde aparecen las fijaciones en el orden en el que se dieron y señalan el recorrido del ojo a través de su señalamiento en números consecutivos. El mapa y el trazado son representaciones que permiten ver, de manera esquemática, el comportamiento de cada individuo en la exploración visual del estímulo. Por otro lado, se emplean tablas en las que se muestra la síntesis de los resultados numéricos, en los cuales aparecen las fijaciones registradas mayores a los 220 ms (Van der Lans, Wedel y Pieters, 2011) y la media de duración de las fijaciones.

Las pruebas se realizan con la participación de sujetos de estudio, los cuales aportan datos en las exploraciones visuales que realizan al ser expuestos a la imagen. Con relación al número de sujetos para los experimentos, Pernice y Nielsen (2009) mencionan que en un estudio cualitativo de percepción visual (Qualitative eyetracking: watching gaze replays), son 6 sujetos los necesarios para analizar su comportamiento con Eye Tracking. A partir de este dato, se toman estos como los mínimos necesarios.

Cada prueba, obtiene una serie de datos como son: clave de identificación y género del sujeto, tiempo de inicio de la fijación (Fixstart), así como duración de la fijación (Fixduration), posición en el eje X de la fijación (FixX), posición en el eje Y de la fijación (FixY). A partir de los datos de visualización derivados de la exploración visual, se cuenta con material para hacer el análisis y la interpretación de resultados, los cuales varían dependiendo del principio que se esté sometiendo a prueba (Color, forma, tamaño, posición, etc.).

En este escrito se explicarán, a continuación, tres casos de investigaciones destinadas a la percepción visual de la imagen. Los experimentos fueron realizados dentro del Laboratorio de Experimentación Multimedia, siguiendo especificaciones ergonómicas y técnicas para su realización; se midieron atributos de la imagen como son el color, la saliencia, la simplicidad y la complejidad de la forma. En el apartado se detalla el experimento que se realizó, se aborda su estructuración, sujetos participantes, la muestra utilizada y los resultados gráficos y numéricos obtenidos en cada análisis, así como las conclusiones generales a las que se llegó con el desarrollo experimental. Los experimentos que aquí aparecen han sido desarrollados en distintos tiempos (del 2018 al 2021) bajo diferentes ópticas, con objetivos distintos. Sin embargo, poseen en común el área de estudio enfocada en la percepción visual y el método basado en el uso del Eye Tracking.



Caso 1: Saliencia del color rojo en la percepción de la imagen


Como método, se llevó a cabo un desarrollo experimental en el que se analizaron un total de tres imágenes cromáticas empleando el Eye Tracking, para reconocer en la imagen la presencia del color rojo como estímulo físico, y determinar si llama la atención por encima de los otros presentes en la imagen (Mancilla, 2021). Para la medición perceptiva del color rojo se utilizó el aparato Eye Tracking (modelo Eye Tribe), que detecta las áreas donde el sujeto fija su atención, el número de fijaciones que realiza el observador y su tiempo de duración, así como el orden en que realiza su exploración visual. El registro se llevó a cabo con el software OGAMA (Open Gaze And Mouse Analyzer), el cual realizó un cálculo de los elementos físicos que destacaron en una imagen a partir de sus características constitutivas, en cuanto a la organización de la forma y su percepción visual. Usando los mapas de calor (heatmap), las rutas sacádicas (scanpath) y las áreas de interés (areas of interest).

Para el desarrollo experimental, se usó como estímulo visual una muestra de tres carteles (C1, C2 y C3) del diseñador suizo Josef Müller-Brockmann (2004). Los carteles contaban con elementos similares en su constitución, en su estructura organizativa y poseían un código cromático con la presencia del color rojo en igualdad de condiciones. Las imágenes se usaron en formato PNG-24, para su proyección en la pantalla de la computadora. Cada estímulo se visualizó en un monitor DELL de 24 pulgadas modelo E2414H con una resolución de 1650 x 1080 pixeles a 60.0310 Hz y un perfil de color sRGB IEC61966- 2. En lo referido a los sujetos de estudio, para conformar este experimento bajo los lineamientos de Pernice y Nielsen, se contemplaron a seis profesores de la Facultad del Hábitat.

Para realizar el análisis, se segmentó cada imagen en áreas de interés (C1, C2 y C3), atendiendo a la disposición del color. Se establecieron tres áreas básicas por cartel: en C1 se marcaron las áreas C1A01(color negro), C1A02 (color rojo) y C1A03 (color verde); en C2 se segmentó en C2A01(color azul), C2A02 (color rojo) y C2A03 (color amarillo); finalmente, en C3 se distribuyó en C3A01(color negro), C3A02 (color rojo) y C1A03 (color azul). En la tabla 1 se sintetizan los resultados numéricos relacionados a las áreas de interés, las fijaciones mayores a los 220 ms y su media de duración.



Tabla 1. Áreas de interés en C1, C2 y C3 contemplando fijaciones y media de duración.

Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2021).



Los resultados permiten observar el comportamiento del ojo frente al estímulo de color, haciendo una representación de las fijaciones de cada uno de los usuarios (1 al 6), la duración de las fijaciones y las rutas sacádicas por usuario en cada área de interés en un lapso de 0-5,000 ms. Se encontró que en C1 se presentan un total de 81 fix mayores a los 220 ms, de las cuales el mayor número se concentra en el color negro (46 fix); de ahí, 36 fix se ubican en un solo punto focal en el mismo color. En el caso de C2, las fijaciones se localizaron 47 fix mayores a los 220 ms, las cuales se concentran en el color rojo (23 fix); de ahí, 16 fix pertenecen a un solo punto focal coincidente en color. En C3, las fijaciones totales fueron 29 fix mayores a los 220 ms, se concentran en el color azul (12 fix); sin embargo, el punto focal está en el negro con 8 fix.



Figura 1. Número de fijaciones en áreas de interés en los carteles de Müller-Brockmann.

Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2021).



En lo referente a la media de duración, se encontró que en C1 se detuvo por más tiempo el ojo (1165 ms) en el color rojo, su concentración máxima en un punto focal fue de 557 ms en el mismo color. En C2, el tiempo se concentró en el color azul (1343 ms) de los cuales 699 ms pertenecen al punto focal del mismo color. En el caso de C3, la duración máxima de las fijaciones fue de 1224 ms, localizados en el color azul; sin embargo, el punto focal se ubica en el color rojo, con un total de 633 ms de duración de las fijaciones del ojo en la exploración visual.



Figura 2. Duración de las fijaciones en áreas de interés en los carteles de Müller-Brockmann.

Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2021).



Los datos indican que, en C1, las franjas de color en las que se concentran las fijaciones (36 fix en el color negro) y el mayor tiempo de las mismas (557 ms en el color rojo) son franjas contiguas, que no cuentan con la misma superficie ni extensión. Por lo tanto, las condiciones formales no son iguales; en cuanto al atributo de color, el negro ocupa una mayor superficie; por lo tanto, capta el mayor número de fijaciones (36 fix/316 ms). Sin embargo, la franja roja, con un menor número de fijaciones (7 fix/557 ms), obtiene un mayor tiempo de duración por ser más atrayente visualmente.

En C2, la mayor cantidad de fijaciones se ubica en el color rojo (16 fix/462 ms) y el mayor tiempo se concentró en una franja de color azul (699 ms/2 fix); las franjas de color, por posición, son coincidentes, sin embargo, por superficie y extensión varían. Finalmente, en el caso C3, en el registro global, el color azul es el que obtiene un mayor número de fijaciones y tiempo de duración de estas (12 fix/1224 ms), aunque la mayor cantidad de fijaciones se concentró en un rectángulo negro (8 fix/387 ms), el cual compite con el rectángulo de color azul que está ubicado al lado en la misma franja (7 fix/467 ms). Esto indica que el ojo se movía entre ambas figuras; sin embargo, con base al tiempo de la media duración, es un rectángulo de color rojo (1 fix/633 ms) el que capta por mayor tiempo la atención visual.

Los resultados obtenidos en la fase experimental del Eye Tracking aportaron una medición precisa de las ubicaciones de las fijaciones y su tiempo de duración; datos que se pudieron comparar entre sí, para medir el comportamiento del estímulo. Este proceso arrojó como conclusión que en C1, por su composición, existe un predominio del color negro, basado en el número de franjas y su superficie y extensión. El color negro, a nivel perceptivo, se le considera como sobresaliente en la escena; sin embargo, el color rojo, con base en los datos aportados por la media de duración de fijaciones, posee mayor pregnancia, lo que deja al descubierto que el color es un estímulo que se ubica por encima de la superficie y extensión de la forma. La pregnancia de un elemento depende en gran medida de su lugar y función dentro del contexto total, ya que el campo visual funciona como una totalidad y todos los elementos de la composición entran en juego en el acto perceptivo para que se de la organización gestáltica (Arnheim, 1976).

En C2 sucedió un fenómeno similar, en relación con el color azul. Este ocupaba un gran porcentaje en la composición y, por tanto, su peso visual era mayor; sin embargo, el ojo se dirigía con más frecuencia al rojo, obteniendo mayor número de fijaciones, lo que enfatiza su nivel de pregnancia. La percepción de un color se ve influenciada no solo por las características propias del estímulo visual, también incide el contexto en el que está situado y la relación de comparación que establece con otros colores contiguos (Cuevas, 2010).

En el caso C3, un rectángulo de color rojo fue el que captó por mayor tiempo la atención visual, pese a estar separado del conjunto; lo que refleja el grado de atracción que ejerce el color rojo sobre el ojo. Esto se debe a que el color se organiza en torno a un punto de máxima tensión, que se da por su luminosidad, saturación, calidez, etc., por ello, se destaca claramente en una zona cromática de la imagen con respecto al resto de la composición (González, 2005). A partir de la ley de semejanza, que postula la Gestalt, los elementos que tienen algún tipo de similaridad se agrupan y se relacionan, aunque estén separados en el espacio. En el caso del color, percibimos como parte de una misma estructura a aquellos elementos que cromáticamente son semejantes; por ello, aunque los elementos aparecieran en C3 separados, se percibían como conjuntos cromáticos.

El color es un elemento perceptivo muy eficaz para llamar la atención, es útil para destacar o diferenciar elementos u objetos dentro de una imagen, puede ser un punto focal para llevar al observador a que inicie la lectura de una imagen, sirve para estructurar una composición, para indicar, para señalar recorridos, etc. Debido a su pronto reconocimiento, sirve para destacar partes funcionales de objetos, crear códigos visuales fáciles de reconocer y de descifrar (González, Cuevas y Fernández, 2005). “El color es, ante todo, una experiencia sensorial, para producirse requiere, básicamente, tres elementos: un emisor energético, un medio que module esa energía y un sistema receptor específico” (Villafañe, 1985, p.111). En el caso del color rojo, por ejemplo, la experiencia cromática se debe específicamente a una fuerte excitación de los receptores rojos junto a una estimulación débil de los receptores verde y azul, dando como resultado una sensación de color rojo.



Caso 2: Análisis de la Saliencia en la obra de arte


El objetivo del estudio de la percepción en la obra de arte consistió en monitorear el proceso de visualización: número de fijaciones, rutas de exploración, duración de la mirada fija en un área de interés y la densidad espacial de las fijaciones (Mancilla y Guerrero, 2020). Partió de un análisis mediante un desarrollo experimental basado en una prueba de rotación y seguimiento ocular con Eye Tracking, obteniendo un patrón de exploración y el trabajo perceptual realizado.

En el análisis perceptual, se identificaron los elementos que son captados por el ojo, así como los patrones de exploración que se realizan por los sujetos que observan la pieza. Para el desarrollo experimental, se utilizó como estímulo la obra de arte Guernica de Pablo Picasso, realizada en 1937 y que actualmente se encuentra en el Museo Nacional Centro de Arte Reina Sofía en Madrid, España. Se analizaron las métricas propuestas de Poole y Ball (2004) que contemplan: número total de fijaciones, duración de la mirada fija sobre un área de interés, densidad espacial de las fijaciones y análisis de rutas sacádicas (Scanpath), con la finalidad de registrar y medir la forma en que el ojo reacciona ante la obra de arte. Para hacer el estudio, esta imagen se adaptó a un tamaño de 1360 × 768 pixeles, para ser proyectada en un monitor de escritorio de 24 pulgadas. Por tanto, el tamaño real de la obra difiere del original de 3.49 m x 7.77 m. Para conformar el experimento, en relación con los sujetos, se contemplaron 10 alumnos de la Facultad del Hábitat de la Universidad Autónoma de San Luis Potosí (5 hombres y 5 mujeres).

La imagen del Guernica se utilizó en formato PNG-24 y preparada para su proyección en la pantalla del monitor, con un tamaño de 1360 x 768 px (ancho y alto), con una resolución de 72 dpi, y un perfil de color sRGB IEC61966-2.1. Para esta fase, se empleó el modelo Eye Tribe para registrar el seguimiento ocular mediante la utilización de luz infrarroja y una cámara que capta la posición de los ojos en el monitor, con un algoritmo matemático graficando las coordenadas en los ejes X y Y. La finalidad consistió en detectar en qué punto de la obra de arte, el sujeto fijó la mirada y por cuánto tiempo, así como las rutas de exploración que realizó. Se usó una computadora Desktop PC DELL XPS 9H52LRT, Intel Core i5, compatible para la conexión del Eye Tribe, y un monitor de 24 pulgadas DELL modelo E2414H con el software “Ogama V. 5.0.5614”, el cual se requiere para la calibración, ajuste y registro de cada una de las pruebas de este experimento. La densidad espacial de las fijaciones se calculó a partir de la ubicación mediante coordenadas en el plano XY de cada una de las 251 fijaciones obtenidas de los 10 sujetos. La gráfica resultante permite ver el comportamiento de estas fijaciones por sujeto y su interacción con las áreas de interés (A1, A2, A3).



Tabla 2. Registro de fijaciones (Fix) y duración (ms) por área de interés. Medición de la obra de arte Guernica.

Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2020).



En la obra Guernica, haciendo una representación de las fijaciones de cada uno de los usuarios (del 1 al 10), la duración de las fijaciones y las rutas sacádicas por usuario en cada área de interés en un lapso de 0-10,000 ms, se encontró que en A01, se presentan un total de 67 fix mayores a los 220 ms., en A02 se registran 124 fix, y finalmente en A03 se presentan 60 fix. Los datos indican que la zona A02 es la que presenta el mayor número de fix, dado que se ubica en la parte central del cartel y cuenta con tres elementos reconocibles, entre ellos dos rostros de figuras humanas y la cabeza del caballo. Sin embargo, en relación al promedio por área del tiempo de fijación, la duración de las fijaciones en el A01 es mayor que en las otras áreas (279ms), dado que los sujetos fijaban su atención en el toro, figura que en el mapa de calor se muestra como el elemento que sobresale en la composición, a pesar de su posición en el campo visual.



Figura 3. Análisis de Seguimiento Ocular con Eye Tracking de la obra Guernica.

Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2020).



En el mapa de calor en la representación global de las fijaciones de todos los sujetos de estudio se observa, a través de puntos calientes que se representan mediante el color (rojo mayor atención), que los ojos tienden a fijar su atención en elementos reconocibles, como son los rostros. En esta obra en particular, los usuarios centraron su mirada en las cabezas del toro y del caballo. Se encontró, mediante la prueba de seguimiento ocular, que los elementos principales que captan la atención de la mirada son los animales; en primer lugar, el toro logró tener un mayor tiempo de fijación debido a su posición dentro de la obra y el grado de contraste que presenta con respecto al fondo; luego, se ubica al caballo, el cual se sitúa al centro de la imagen, por lo que presentó un mayor número de fijaciones aunque con menor tiempo; finalmente los rostros de las figuras humanas lograron captar la atención de la mirada de los sujetos.

En el análisis de seguimiento ocular con Eye Tracking, los sujetos presentaron una mayor fijación en las cabezas del toro y del caballo, dado que la detección de un estímulo visual con unas características concretas y diferenciadas dentro de una serie de estímulos, que no las tienen, sobresale si entre ellos se incluye alguno que es radicalmente distinto a todos los demás en cuanto a características tales como el color el brillo o la orientación (Tejero, 1999). Por ello, las figuras de los animales se destacan más que las figuras humanas, ya que nuestra atención tiende a orientarse hacia un estímulo que se destaca por contraste, a pesar de la presencia de otros elementos con características que contrastan menos con las del resto y por ello pasan desapercibidos (Egeth y Yantis, 1997).



Figura 4. Mapa de calor del análisis con Eye Tracking de la obra Guernica.

Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2020).



Los principales puntos de atención son los rostros de las figuras humanas y, en especial, las cabezas de los animales. Esto se debe a que, en el acto perceptivo, tendemos a percibir imágenes reconociendo formas que nos son familiares, porque ya las conocemos por nuestras experiencias en el mundo empírico de la realidad visible; o que retenemos en la memoria a través de una especie de matriz muy general, que funciona como una especie de esquema icónico que existe en la mente (Costa, 2003). En relación con los niveles de iconicidad de la imagen, cuanto más icónica o figurativa sea esta, es más fácil de captar porque requiere del espectador un mínimo esfuerzo o una casi nula capacidad de abstracción. Los personajes del mural no poseen un nivel de abstracción elevado, todos ellos son fácilmente reconocibles y, sin embargo, casi todas sus características de forma se encuentran alteradas (Villafañe, 1985).

El análisis de rutas sacádicas mostró que los recorridos se hacían de la A02 a A01 principalmente, lo que corrobora la importancia de A01 y la presencia del toro como elemento principal en dicha área. El orden de lectura de la composición de la obra es de derecha a izquierda, lo que se hace evidente por la posición y la dirección de las figuras; en este sentido, la composición privilegia la ubicación de la cabeza del toro, aunque teóricamente la zona en la que los elementos deben adquirir un mayor peso compositivo corresponde al lado contrario, en el cuadrante superior derecho (Dondis, 1992). La pregnancia de este elemento depende en gran medida de su lugar y función dentro del contexto total, ya que el campo visual funciona como una totalidad y todos los elementos de la obra entran en juego en el acto perceptivo para que se presente la Gestalt (Arnheim, 1976).

La percepción visual consiste en obtener información del entorno mediante lo que capta el ojo e interpreta el cerebro. Este acto perceptivo comienza con la aprehensión de los rasgos estructurales sobresalientes y globales de la obra de arte, los cuales constituyen los datos primarios para la percepción. Según Arnheim (1976), la visión trabaja mediante la experiencia y crea un esquema correspondiente de formas generales, que son aplicables no sólo al caso individual del momento, sino también a un número indeterminado de otros casos similares.

Señala Gaetano (1980) que, cuando las cosas están dispuestas de tal modo, podemos recordarlas fácilmente, porque cuentan con un orden en la organización estructural de la forma. Esto permite entender que, en la creación de esta obra de arte, se generan esquemas de organización de la forma, en donde los rasgos salientes no sólo determinan la identidad del objeto percibido, sino que además hacen que se nos aparezca como un esquema completo e integrado. Se muestra cómo los ojos agrupan la forma, mediante un ejercicio del cual resulta una estructura simple, ordenada y regular para ser identificada y recordada.



Caso 3. Percepción de la simplicidad y complejidad de la forma


Se realizó un análisis de los procesos de organización y reconocimiento visual, con la finalidad de registrar y medir la forma en que el ojo reacciona ante diferentes estímulos relacionados con la composición de la imagen. Para el desarrollo experimental se tomaron dos estímulos visuales, uno simple y otro complejo (Mancilla, E., Guerrero, M, 2018); el Cartel “Victory” (C1) de Shigeo Fukuda (Japón, 1975), obra que se caracteriza por su simplicidad en la organización de la formal; y el Cartel “The Public Theater” (C2), realizado por Paula Scher en 1995, el cual cuenta con diferentes planos, tamaños variados, orientaciones y direcciones múltiples. En general, presenta diversidad en elementos, formas asimétricas, irregulares y discontinuas. Las imágenes se usaron para su proyección en la pantalla del monitor en formato TGA 24 bits, en un tamaño de 1366 x 768 px (ancho y alto), con una resolución de 72 dpi, y un perfil de color sRGB IEC61966-2.1.

Se utilizó en el experimento una computadora compatible para la conexión del Eye Tribe (modelo de Eye Tracking), Desktop PC DELL XPS 9H52LRT, Intel Core i5, y un monitor de 24 pulgadas DELL modelo E2414H con el software “Ogama V. 5.0.5614” (Mancilla, Guerrero y Carrillo, 2018). En relación con el apartado de los sujetos de estudio, se conformó el experimento con un grupo de 30 alumnos (15 mujeres, 15 hombres). Los resultados obtenidos de los datos duros que aportó el seguimiento ocular, en la fase experimental, se describieron y se interpretaron acorde a la teoría de la percepción Gestalt, lo que permitió observar procesos de organización y reconocimiento visual, que atienden a la simplicidad y/o complejidad de la forma y la estructura. Para realizar el mapeo de datos, con la participación de usuarios, se segmentó la imagen por zonas o áreas de interés, y se establecieron en C1 las siguientes: A01 (Cañón), A02 (Texto) y A03 (Bala) y en el C2, se establecieron: A01 (Texto PUBLIC), A02 (Figura humana) y A03 (Texto FUNK).



Tabla 3. Registro de fijaciones (Fix) y duración (ms) por área de interés. Imagen simple C1e

imagen compleja C2. Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2018).



En los resultados, se muestran las zonas de calor, y se puede observar cómo el principal punto de atención en C1 se encuentra en A0, y en el caso de C2, se ubica en A02; estos son puntos de atención que generan mayor concentración de fijaciones o mayor tiempo de visualización. En el Cartel 1, se encontró que en A01 se presentan un total de 96 fix mayores a los 220 ms., en A2 se registraron 49 fix y, finalmente, en A3 se presentaron 84 fix. Los datos indican que la zona A01 es la que presentó el mayor número de fijaciones, dado que se ubica en la parte central del cartel. Sin embargo, tomando como base el promedio por área del tiempo de fijación, la duración de las fijaciones en el A02 es mayor que en las otras áreas (372 ms), porque los sujetos, al dar lectura al texto (VICTORY), demandan mayor tiempo en esta tarea.



Figura 6. Análisis de rutas sacádicas: media de fijación y número de fijaciones en áreas de interés en C1.

Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2018).



La relación entre A01-A03 es similar, ya que, por composición, se da la continuidad en la figura y predomina el eje diagonal, entendiéndose como un solo elemento la Bala-Cañón. En cuanto a las rutas sacádicas, se encontró que el recorrido de A01 a A03 es el más representativo, dado que conjunta el 33% del total de las fijaciones de la suma de los recorridos de exploración visual de los 30 sujetos que formaron parte del experimento; el 27% se concentró en la ruta sacádica A03-A01, es decir, el recorrido de manera inversa. La visualización en el eje diagonal es la que predomina según el estudio realizado.

En cuanto a la ruta A01-A02 (Cañón-Texto) cuenta con un 14% de las fijaciones, lo que señala al texto como un elemento secundario supeditado a la imagen, ya que los desplazamientos son menores hacia A02; el recorrido de A02-A03 (Texto- Bala) abarca el 12%, lo cual se relaciona con la proximidad entre el texto y la bala; lo que se enfatiza en la ruta de regreso de A03-A02 con un 11%. Finalmente, en la ruta de A02 a A01 es donde se tuvo el menor porcentaje del 4%, a partir de la distancia entre el texto y la imagen y en función del orden de exploración, el cual, de manera general, se observa que es de abajo hacia arriba y de izquierda a derecha. En síntesis, se puede decir que el conjunto de estímulos en C1 atienden a la “buena forma”, la cual establece que en las formas que aparecen condiciones de igualdad, se perciben como una unidad; donde los elementos que presentan el mayor grado de simplicidad, regularidad, simetría, coherencia estructural y estabilidad son los que se requieren para el reconocimiento visual un esfuerzo menor.

En el Cartel 2, se encontró que en A01, se presentan un total de 69 fix mayores a los 220 ms., en A02 se registran 76 fix, y, finalmente, en A03 se presentan 34 fix. Los datos indican que la zona A02 es la que presenta el mayor número de fijaciones, dado que la imagen resalta más que la tipografía y posee el primer nivel de atención, lo que corresponde con el promedio del tiempo de fijación por área; la duración de las fijaciones en el A02 es mayor que en las otras áreas (296 ms). La relación entre A01 y A03 es similar, debido a que son los puntos en los que el peso visual es mayor debido al tamaño de la tipografía (Public-Funk). En cuanto a las rutas sacádicas, se encontró que el recorrido de A02-A01 (Figura humana-Public) es el más representativo, dado que cuenta con el 46% del total de las fijaciones; el segundo valor se concentró en la ruta sacádica de A01-A02, el recorrido inverso contó con el 19% de las fijaciones (Public-Figura humana). En segundo lugar, se ubica el recorrido de A02-A03 (Figura humana-Funk) con el 14% de las fijaciones; la ruta de visualización A01-A03 (Public-Figura humana) contó, en ambas direcciones, con un porcentaje del 8%, lo que refleja la poca interacción entre ambas zonas; y finalmente, el recorrido de A03-A02 (Funk-Figura humana) contó con el 5%.



Figura 4. Análisis de rutas sacádicas: media de fijación y número de fijaciones en áreas de interés en C2. Laboratorio de Experimentación Multimedia, Facultad del Hábitat, UASLP.



Nota. Fuente: Mancilla (2018).



Este estudio se enfocó en mostrar los procesos de organización y reconocimiento visual que atienden a la simplicidad de la forma y la estructura, mediante el análisis comparativo de dos casos, uno de organización simple y el otro complejo. La captación visual de la forma y el fondo varían dependiendo de la simplicidad o la complejidad de la estructuración de la forma; por tanto, la energía empleada para percibir varía. En el caso C1, la exploración visual que se realizó es menor, y se enfocó en la captación de la imagen sobre el fondo; y en el caso C2, la imagen no cuenta con una clara diferenciación entre el fondo y la imagen. Por ello, el trabajo perceptivo resultante es mayor, presentando fijaciones mayores y más recorridos del ojo, demostrando con ello que el reconocimiento de la forma resulta más complejo.

La diversidad de las relaciones que los elementos de la imagen pueden crear es lo que hace que una imagen sea compleja. La complejidad implica una complicación visual a partir de la presencia de numerosas unidades y fuerzas elementales, que dan lugar a un proceso de organización más difícil, basado en la descomposición de los elementos en piezas separadas que se interrelacionan entre sí. Según la teoría Gestalt, en igualdad de condiciones, tendemos a percibir como parte de un mismo objeto los elementos que son semejantes, en este caso por atributos como forma, color, tamaño, y orientación (Cuevas, 2010). Señala Irvin Rock (1985), que las unidades enteras que percibimos no son solo el resultado de un proceso de organización que unifica unos elementos, sino que estas unidades están relacionadas entre sí, hasta el punto de crear una configuración cuyas propiedades no residen en las partes, sino en el conjunto.

La Gestalt no es algo que posean los objetos, sino que hace referencia a un “reconocimiento” por parte de un observador; solo se manifiesta en la percepción del estímulo cuando se reconoce la estructura de este (Villafañe y Mínguez, 1996). La simplicidad de la imagen y el orden que esta posea determinan, en gran medida, la exploración visual de la composición. Una obra simple requiere e implica menos esfuerzo visual para reconocerla; por otro lado, la complejidad, cuenta con una complicación visual debido a la diversidad de las relaciones que los elementos de la imagen pueden crear, por la presencia de numerosas unidades, lo que implica un trabajo perceptual mayor.



Conclusión


El mostrar estos casos de experimentación es importante porque deja un precedente de las investigaciones que se están desarrollando dentro de las universidades, como espacios formativos y de investigación para el crecimiento de la disciplina del diseño gráfico. El objetivo de este escrito se centró en describir dichos experimentos, exponiendo el método y los resultados obtenidos. Se registró y explicó la forma en la que se llevan a cabo, el equipo que se utiliza, así como sus especificaciones técnicas; lo anterior con la finalidad de que se puedan replicar en las mismas condiciones o variando alguna de ellas. Se ahondó en los resultados y su interpretación para brindar al investigador una forma de procesamiento de datos e informaciones numéricas y gráficas relacionadas con las fijaciones realizadas, la duración de las fijaciones, las rutas de exploración, etc.

A partir de la exposición de tres casos de investigaciones de percepción visual realizadas con ayuda del Eye Tracking, se puede constatar el papel fundamental de la tecnología en estudios relacionados con el área de diseño, ya que, mediante la utilización de equipos y software especializado se llevan a cabo registros más exactos de la exploración visual realizada. El contar con datos numéricos y gráficas (Mapas y trazados de ruta) permite entender de mejor manera cómo se lleva a cabo el acto perceptivo, lo que ayuda al entendimiento de cuestiones relacionadas con la forma y composición de la imagen.

Los estudios realizados con Eye Tracking, en el campo de la percepción visual, son otro recurso más para el análisis de la imagen en áreas como el diseño y el arte; se vuelve una herramienta fundamental al hacer un registro más exacto de lo que el ojo hace durante una exploración visual, este recurso aplicado al análisis de la imagen otorga la posibilidad de entender cómo atributos como la forma, la posición, el tamaño, el color, entre otros, inciden en el acto perceptivo y sirven de guía al ojo en el recorrido que hace sobre la imagen. En suma, esto nos permite entender al diseño desde otra perspectiva, la perceptual.




Referencias


Amheim, R. (1976). El pensamiento visual. Eudeba.

Costa, J. (2003). Diseñar para los ojos. Grupo Editorial Design.

Cuevas Rianjo, M. (2010). Percepción visual, psicología de la Gestalt y leyes de organización perceptiva. En: R. Diaz Padilla. Distorsión, Equívocos y Ambigüedades: Las Ilusiones Ópticas en el Arte. Universidad Complutense de Madrid.

Dondis, D. A. (1992). La sintaxis de la imagen. Gustavo Gili.

Egeth, H. and Yantis, S. (1997). VISUAL ATTENTION: Control, Representation, and Time Course. Annual Review of Psychology, 48, pp. 269-297.

González, J., Cuevas, M., y Fernández, B. (2005). Introducción al Color. Akal.

Kanizsa, G. (1980). Gramática de la visión: Percepción y pensamiento. Paidós

Mancilla, E., Guerrero, M y Carrillo, I. (2018). La Percepción de la Simetría y el Equilibrio a partir del Registro Visual. En E. Mancilla y M. Guerrero (Coords.). Memorias en Extenso Seminario Internacional Virtual Vanguardias del Diseño (pp. 165-174). Universidad Autónoma de San Luis Potosí.

Mancilla, E., Guerrero, M. (2018). Análisis de la Forma en el Proceso de Percepción Visual. En J. Sierra y J. Gallardo (eds.). Identidades Culturales, Narrativas Creativas y Sociedad Digital (pp. 75-84). Global Knowledge Academics.

Mancilla, E., Guerrero, M. (2020). Análisis del Proceso de Percepción Visual en la Obra de Arte. En R. Cabrera (ed.). Rumbos Atrevidos, pero Necesarios: Conversaciones entre Innovación, Arte y Creatividad (pp. 81-92). GKA Ediciones.

Mancilla, E. (2021). El Análisis de Saliencia en la Percepción Visual del Color. En L. Irigoyen y R. Erika (eds.). Prospectiva del Diseño. Redefiniendo el Futuro Disciplinar (pp. 200-218). Qartuppi, S. de R.L. de C.V.

Müller-Brockmann, J., y Müller-Brockmann, S. (2004). History of the poster. Phaidon.

Pernice, K. y Nielsen, J. (2009). How to Conduct Eye Tracking Studies? Niel- sen Norman Group.https://media.nngroup.com/media/reports/free/How_to_Conduct_Eyetracking_Studies.pdf

Tejero, P. (1999). Panorama histórico-conceptual del estudio de la atención. En Atención y Percepción (pp. 33-62). Alianza Editorial.

Van der Lans, R., Wedel, M. and Pieters, R. (2011). Defining eye-fixation sequences across individuals and tasks: the Binocular-Individual Threshold (BIT) algorithm. Behavior Research Methods, 43(1), 239–257.

Rock, I. (1985). La percepción. Editorial Labor.

Scott, R. (2017). Fundamentos del Diseño. Limusa

Van der Lans, R., Wedel, M. y Pieters, R. (2011). Defining eye-fixation sequences across individuals and tasks: the Binocular-Individual Threshold (BIT) algorithm. Behavior Research Methods, 43(1), 239–257.

Villafañe, J. (1985). Introducción a la Teoría de la Imagen. Pirámide.

Villafañe, J. y Mínguez, N. (1996). Principios de teoría general de la imagen. Pirámide