VER SIN MIRAR. EL RETRATO SINTÉTICO POR VISIÓN ARTIFICIAL EN LA PRÁCTICA ARTÍSTICA
Universidad Miguel Hernández de Elche (España)
Resumen:
El artículo traza un recorrido por prácticas artísticas desarrolladas en la última década en torno a la representación sintética del rostro por medio de herramientas de visión artificial para el reconocimiento facial y el promediado de la imagen, partiendo del origen histórico de estos procedimientos y descubriendo sus vínculos con las metodologías actuales, para concluir con una reflexión acerca de su repercusión en prácticas relacionadas con la identidad contemporánea, el control y la vigilancia.
Palabras clave: Visión artificial, New Media Art, Reconocimiento facial, Retrato compuesto, Arte generativo
Abstract:
This paper traces a path through art practices developed in the last decade around the synthetic representation of the face by means of computer vision tools for face recognition and the averaging of the image, starting from the historical origin of these procedures and discovering their links with current methodologies, to conclude with a reflection about its impact on practices related to contemporary identity, control and surveillance.
Keywords: Computer vision, New Media Art, Face recognition, Composite portrait, Generative Art
* * * * *
1. Introducción
La aparición de bibliotecas de software libre de visión artificial1 a finales del siglo pasado y el paralelo desarrollo de los ordenadores personales, ha propiciado que la visión artificial se haya convertido en un recurso habitual en numerosos trabajos artísticos englobados en el New Media Art de los últimos años, ampliando las fronteras de los espacios de actuación en los que hasta entonces se enmarcaba y posibilitando su aplicación por parte de usuarios que carecen de especialización en el campo de la inteligencia artificial o el procesamiento de datos.
Aunque las aplicaciones de visión artificial dentro de la práctica artística son múltiples, siendo su uso bastante común en diversas instalaciones interactivas donde se usa la detección de movimiento, la presencia de personas, la detección a través del umbral de brillo o el seguimiento de objetos2 , en este ensayo se incluyen distintos trabajos que explotan sus capacidades para el reconocimiento de objetos —en concreto el reconocimiento facial— junto al promediado de imágenes a partir de algoritmos computarizados.
Tanto el reconocimiento facial como el promedio del rostro, tiene su origen en las prácticas fotográficas en torno a la estadística desarrolladas de forma paralela, a partir del último cuarto del siglo XIX, por el antropólogo francés Alphonse Bertillon (1853-1914) y el polímata de origen británico Francis Galton (1822-1911), que sentaron las bases de ambos sistemas de representación fijando algunos esquemas que se han venido usando hasta la actualidad.
En la última década se han llevado a cabo distintos trabajos artísticos que exploran simultáneamente estas dos vías de actuación, actualizando por medio de la visión artificial la fotografía decimonónica y dándole un nuevo sentido. Algunos de estos trabajos pertenecientes al Arte de los Nuevos Medios, también pueden enmarcarse, como veremos, dentro del Arte Generativo.
Para el presente artículo se parte de un acercamiento histórico a las prácticas fotográficas en torno al reconocimiento facial y el retrato compuesto a través del promedio; seguido de un breve estudio sobre cómo la visión artificial ha renovado estas prácticas automatizando sus mecanismos y ampliando sus posibilidades; y finalizando con el análisis de distintos trabajos artísticos que explotan, desde diversas perspectivas, las herramientas computarizadas para la detección y el promedio del rostro para crear un retrato sintético.
Por lo tanto, los objetivos de este estudio se centran en analizar los antecedentes y el origen histórico de las prácticas por visión artificial en torno alreconocimiento facial y el promediado de la imagen para la construcción de un rostro sintético, así como examinar el uso de este tipo de representación en la práctica artística desarrollada en la última década para, además, averiguar el significado que adopta este tipo de retrato como representación del individuo contemporáneo.
2. El sistema antropométrico y el retrato compuesto
La expansión y abaratamiento de la fotografía que se produjo a mediados del siglo XIX, acabó con la exclusividad de las clases más poderosas como único estrato social con un verdadero acceso al retrato, que hasta la fecha era propio del medio pictórico, convirtiéndose en un codiciado objeto de lujo para las “clases sociales privilegiadas, cuidadosas de su persona y de la perpetuación de su recuerdo”3 . Poco tiempo después de la invención de la fotografía, el retrato ya se había posicionado como el motivo fotográfico por excelencia, multiplicándose los estudios de fotografía dedicados exclusivamente a este género y produciendo instantáneas de forma masiva, lo que originó una gran industria alrededor del medio fotográfico.
Conforme avanzaba el siglo, los usos fotográficos se amplían hacia el ámbito de la ciencia, lo que conlleva la aparición y desarrollo del retrato científico que implica a la vez un giro en la condición del sujeto fotográfico. Si hasta ahora el género del retrato se había ocupado de representar a individuos principalmente para honrarlos, con este nuevo uso científico del retrato alejado de lo estético y que atendía a los principios positivistas de la época, se invierte el carácter rememorativo hacía una función primordialmente represiva, de control y de estudio del individuo. Tal y como argumenta Sekula, comienza así a constituirse el gran archivo común que incluye a todos: tanto a celebridades, héroes, líderes… como también a pobres, enfermos, locos y criminales4 . El retrato fotográfico ya no solamente era una representación que materializaba en forma de imagen el rostro, sino que éste se había transformado en datos numéricos y estadísticos para documentar la desviación social, impulsando el control del individuo a través de los nuevos dispositivos y profesiones relacionadas con las ciencias sociales y antropológicas, tomando “el cuerpo y su entorno como campo de acción, como ámbito de conocimiento, y redefiniendo lo social como el objeto de sus intervenciones técnicas”5 .
En este sentido, en el último cuarto del siglo XIX apareció en Francia un tipo de retrato científico con el propósito de facilitar la identificación de criminales reincidentes a través de la antropometría y la fotografía. La necesidad de este sistema, denominado bertillonage, surge cuando su impulsor Alphonse Bertillon ingresa en la Prefectura de Policía de París como encargado de registros y se ve incapaz de clasificar las miles de fotos y fichas que durante años se había realizado sin ningún tipo de control 6. La idea del bertillonage le sobrevino cuando al cortar distintos retratos fotográficos de criminales y yuxtaponer sus rasgos, pudo comprobar que no encajaban perfectamente, cuestionándose la idea de que no existen dos individuos exactamente iguales, pues invariablemente aparecen diferencias minuciosas de tamaño, forma, color o textura que distinguen sus partes del cuerpo 7. Como buen conocedor de la estadística —su padre y hermano eran estadísticos— Bertillon piensa que tomando las medidas pertinentes de distintas partes del cuerpo de cualquier individuo, podría desarrollar un sistema de identificación bastante preciso8 que permitiese reconocer a cualquier criminal fichado por la policía, independientemente de que modificase su aspecto físico, basándose en la creencia de que existen zonas corporales y faciales que permanecen inmutables con el tiempo a partir de cierta edad. Este sistema, presentado en fichas de identificación, se componía principalmente de tres piezas: una fotografía, una descripción y una parte antropométrica. El tipo de fotografía empleada se correspondía con un doble retrato fotográfico de frente y perfil denominado retrato judicial, ejecutado bajo las precisas instrucciones de Bertillon con el fin de estandarizar este tipo de retrato y evitar el desorden anterior de los registros fotográficos de la prefectura, donde las imágenes se realizaban desde distintos ángulos y condiciones. Por otro lado, se tomaba una serie de medidas correspondientes con distintas partes del cuerpo y el rostro que quedaban anotadas junto al doble retrato. La ficha finalmente se completaba con una descripción morfológica denominada portrait parlé, que consistía en una descripción verbal de las características físicas del sujeto. El conjunto de fichas formaba una base de datos con la que comparar los nuevos registros y poder determinar si el sujeto detenido ingresaba por primera vez en la prefectura o ya se había inscrito con anterioridad.
El método de fichas antropométricas de Bertillon supone el primer sistema de control de reconocimiento e identificación facial. A pesar de ser corroborado por humanos, a diferencia de los procedimientos computarizados modernos, su tasa de éxito fue bastante alta, identificando a miles de criminales hasta principios del siglo XX, cuando el sistema fue abandonado tras la muerte de Bertillon y sustituido por la dactiloscopia, un sistema de identificación propulsado por Francis Galton.
El propio Galton —que por entonces también andaba experimentando con la antropometría— quedó impresionado con la habilidad y celeridad del equipo de Bertillon, así como con el método de combinar fichas en las bandejas móviles y el uso de boletos de colores que ayudaban en las subdivisiones9 . Él mismo propuso un sistema de identificación que mejoraba en cuanto a rapidez el método de Bertillon. Se trataba de un aparato denominado selector mecánico, que estaba basado en fichas troqueladas que contenían conjuntos de medidas de cada individuo y de un sistema de cables capaz de cotejar, a partir de estas medidas, varios cientos de fichas con cada movimiento 10. El dispositivo no fue desarrollado en profundidad por lo que su trascendencia no fue muy notable, pero otros sistemas desarrollados por Galton tuvieron más difusión. Quizás la aportación por la que más se le conozca —al menos en el ámbito de la fotografía científica— es por su sistema de fotografía compuesta iniciado alrededor de 1877. El procedimiento de este sistema consistía en realizar un retrato promediado a partir de un conjunto determinado de rostros, utilizando para ello la exposición múltiple, obteniendo así una “impresión fotográfica del rostro abstracto” 11 que sintetizaba los rasgos medios de un grupo social, y que representaba el retrato de un tipo en vez del de un individuo.12
Tanto el sistema de Bertillon como el de Galton tuvieron bastante alcance desde sus inicios en el último cuarto del siglo XIX, hasta que cayeron en desuso y fueron sustituidos por otros sistemas más prácticos y su eficacia fue cuestionada, pero su influencia en sistemas posteriores es indudable, sentando las bases de distintos procedimientos que llegaron con el desarrollo de la informática.
3. El reconocimiento facial por visión artificial y el promedio computarizado
La visión artificial comprende un terreno vasto de posibilidades, por lo que definirla de una manera simple resulta complicado, pero se podría entender como la transformación de los datos obtenidos de una cámara fotográfica o de vídeo en una nueva representación, construida para lograr algún objetivo particular 13, lo que posibilita al ordenador comprender las imágenes del mundo real, para a través de distintos algoritmos generar información y realizar deducciones inteligentes. El reconocimiento facial por computadora es inherente a la visión artificial y su desarrollo, convirtiéndose en un método potencial de identificación frente a otros más precisos —como el sistema de huellas dactilares o escaneo del iris— gracias a que no supone un procedimiento invasivo a la hora de obtener datos.
El uso de la visión artificial para la detección y el reconocimiento facial abarca un amplísimo espectro de aplicaciones que usamos habitualmente casi sin darnos cuenta: smartphones que se desbloquean al reconocer el rostro de un usuario; cámaras que fijan el enfoque en las personas presentes en el encuadre o cámaras que disparan una foto cuando una persona sonríe; aplicaciones fotográficas que deforman, intercambian o superponen distintos atributos a los rostros que detectan; redes sociales que sugieren a sus usuarios etiquetar a otros usuarios que han sido reconocidos en imágenes, o fototecas digitales que crean álbumes y ordenan las fotos de forma automática en base a las personas que aparecen en las imágenes.
En sus inicios estuvo asociada a usuarios especializados en el campo de la computación, pero con el surgimiento de bibliotecas de código abierto su uso se simplificó, abriéndose a otros medios de actuación y teniendo bastante repercusión, por ejemplo, en el ámbito artístico. Uno de los programas open source más extendidos y completos es OpenCV, una biblioteca de visión artificial diseñada para la eficiencia computacional y con un fuerte enfoque en aplicaciones de actuación en tiempo real, cuyo principal objetivo es proporcionar una infraestructura de visión por computadora fácil de usar que permita crear aplicaciones sofisticadas 14. Lo característico de OpenCV es la gran cantidad de funciones en distintas áreas que contiene, como una biblioteca completa de machine learning 15 centrada en el reconocimiento de patrones estadísticos y su agrupación, de la que depende la función destinada a la detección y reconocimiento facial.
En el proceso de ejecución del método de identificación facial dentro de la visión artificial se incluyen dos procedimientos: el primero se centra en la detección de rostros, y se basa en la realización de una operación computacional para extraer un rostro de una imagen; la segunda parte tiene que ver con el proceso de reconocimiento facial en el que el ordenador compara la cara extraída de la imagen con las contenidas en una base de datos hasta encontrar un esquema facial coincidente. El programa encargado de decidir si una imagen es positiva —que contiene una cara— o negativa —que no contiene ninguna cara— se denomina clasificador, y es un tipo de software entrenado con numerosas imágenes faciales y no faciales para aprender a clasificar correctamente una nueva imagen. Algo parecido ocurre en la percepción visual humana, donde reconocer a un individuo a partir de su cara precisa de un grado mayor de sensibilidad que la de reconocer sólo la configuración básica de ojos, nariz y boca que especifica una cara16 , siendo “a través de los procesos de aprendizaje por los que llegamos a clasificar ciertas configuraciones como equivalentes y distintas a otras” 17, por lo que se puede establecer una analogía entre el entrenamiento del software clasificador de la visión artificial y el proceso de aprendizaje de los humanos.
Entre los sistemas de reconocimiento facial más utilizados encontramos métodos holísticos —que tienen en cuenta el rostro como un todo— y otros que actúan a través del análisis de las distintas regiones del rostro. Los más conocidos son los sistemas Eigenfaces y el método LBPH. El primero responde a un procedimiento de reconocimiento facial basado en la apariencia, donde a través de una especie de mapas que registran las variaciones entre un conjunto de imágenes de características similares, se proyecta la imagen del rostro que se quiere identificar en el subespacio de estos mapas para comparar de forma holística su posición con la de los distintos rostros ya conocidos por el sistema. El segundo método denominado LBPH, o método de patrones binarios locales, se basa en la división por regiones del rostro, y donde se aplica a cada zona un histograma con el que se obtiene una secuencia binaria que contiene la información de cada región. Finalmente, estas descripciones locales son enlazadas para construir una descripción global del rostro.
En los métodos holísticos de reconocimiento facial se origina una reutilización en forma de eigenfaces de los retratos compuestos galtonianos18 , por el hecho de que se comprimen distintos datos que provocan una eliminación de información facial no deseada. A pesar de que su procedimiento es bastante distinto, resulta curioso el parecido estético que se produce al comparar la representación visual de algunos eigenfaces con los retratos genéricos del siglo XIX (Figuras 1 y 2). En cambio, el sistema de promediar distintas imágenes a través de un algoritmo computarizado sí coincide con la fórmula utilizada por Galton para conseguir el retrato compuesto. El método de éste consistía en dividir el tiempo normal de exposición de una imagen fotográfica entre el número de rostros que conformaban el compuesto, para así obtener un retrato promediado. La operación que realiza la computación para el promediado de imágenes digitales es similar y se basa en los valores numéricos de los píxeles, estableciendo una media que se obtiene al dividir la suma de los valores de los distintos píxeles de cada imagen entre el número total de imágenes a promediar.
4. La detección facial por visión artificial y el retrato compuesto computarizado como recurso artístico
En la práctica artística reciente, la identificación facial por visión artificial supone un medio habitual en numerosas instalaciones interactivas. Como se ha visto, la evolución y libre distribución de software específico en el campo de la visión artificial ha propiciado un mayor acceso y desarrollo de este tipo de aplicaciones. Algo parecido ha ocurrido con el promediado de lotes extensos de imágenes, que se ha convertido en una práctica trivial19 por lo sencillo de su aplicación, debido —entre otras cuestiones— a que algunos editores gráficos ya tienen implementada esta función.
Más exclusivos resultan una serie de trabajos artísticos que mezclan desde distintos puntos de vista estas dos herramientas, obteniendo como resultado un retrato sintético generado a partir de la fusión de distintos rostros identificados por visión artificial. Se podría establecer dos grupos de trabajos en función de su metodología: los que utilizan el reconocimiento facial para detectar fotografías con rostros a través de distintas páginas web o motores de búsqueda de contenido en Internet y así crear una base de datos como fuente de imágenes para el retrato sintético; y los que aprovechan la visión artificial para generar retratos compuestos en tiempo real a partir de las imágenes obtenidas de los usuarios que participan en instalaciones de arte interactivas.
Uno de los trabajos que se podría incluir en el primer grupo es I dreamed about a human being (2008 hasta la actualidad) de Fran Simó (1973), que el autor describe como “parte de un proyecto que explora el uso de la inteligencia artificial aplicada a la fotografía utilizando código y datos abiertos en Internet”20 , y donde a través de un algoritmo capaz de detectar objetos en imágenes fotográficas, se realiza una búsqueda masiva sobre millones de imágenes publicadas con licencias Creative Commons en la plataforma Flickr. Una vez que la base de datos es lo suficientemente extensa, se detiene la búsqueda para procesar las imágenes con el algoritmo y cuando éste detecta una cara en una imagen, re-encuadra el rostro y recorta la fotografía conforme a las pautas aprendidas durante su entrenamiento, para el que se ha utilizado “un conjunto de rostros frontales con iluminación regular, ojos debajo de los puntos de intersección superiores de la regla de tercios y la boca en el tercio medio inferior” 21, con el objetivo de “enseñar al algoritmo a encontrar retratos dentro de las fotografías” 22, supervisando su aprendizaje y corrigiéndolo hasta obtener resultados satisfactorios. Mean (Figura 3), el retrato compuesto resultante, fue realizado a partir de una base de datos que constaba de 5 millones imágenes, de las cuales 166.000 eran imágenes que contenían algún rostro, y de las que solamente 257 fueron promediadas porque se ajustaban a los parámetros establecidos por el autor, como por ejemplo que las imágenes cumpliesen con unas dimensiones mínimas. Si Francis Galton veía en el retrato compuesto “una imagen similar a la que vería un hombre dotado de una imaginación pictórica desarrollada en altísimo grado”23 , Fran Simó se cuestiona el modo en cómo nos ven las máquinas.
Aparte del promedio del retrato genérico, Simó va publicando en Internet periódicamente tanto la colección de imágenes identificadas por el algoritmo como los créditos de estas imágenes 24. En 2015 el proyecto contaba con una base de datos de 88 millones de imágenes, entre las cuales se habían detectado más de un millón de caras. Resulta impresionante poder visibilizar estas hojas de contacto (Figura 4), que evidencian la condición que adoptan las imágenes al ser publicadas en la red y lo accesible que resulta su identificación a través de un algoritmo al alcance de cualquier usuario, recordándonos la doble naturaleza del retrato fotográfico: como una representación capaz de preservar el recuerdo y la memoria, pero también como mecanismo de archivo y control.
Lo pertinente de este trabajo resulta de mezclar desde un punto de vista original los postulados tanto de Bertillon, por el hecho de crear de forma sistematizada un gran catálogo de individuos que gracias a un algoritmo son reencuadrados y recortados de forma uniforme; y de Galton, realizando un retrato compuesto que aun no basándose en un grupo social concreto, representa un vasto número de individuos singulares a través de su máscara, que definiríamos “como aquello que oculta esa singularidad, aquello que lo remite a un tipo, a una categoría, a un estereotipo”25 .
El proyecto de Simó va ampliándose en segundo plano con el tiempo, conforme el sistema va descargando imágenes de forma automática de Internet y posteriormente detectando rostros en las mismas imágenes, por lo que podría encuadrarse dentro de la práctica del Arte Generativo, en el sentido de que la obra se produce, al menos en parte, por algún proceso que escapa al control directo del artista26 .
Algo parecido ocurre en otro trabajo que combina la detección facial y el promedio, en el que la construcción del rostro sintético no puede ser controlada en su totalidad. Se trata de la obra Memory (2013) del dúo artístico surcoreano Shinseungback Kimyonghun (formado por Shin Seung Back, 1979 y Kim Yong Hun, 1980). La pieza consta de una pantalla digital dotada de una cámara que realiza una fotografía del rostro de la persona que se sitúa frente a la pantalla (Figura 5). Con estas imágenes, un sistema informático provisto de un software personalizado va realizando un retrato promediado, por lo que cada vez que la cámara detecta un nuevo rostro, el sistema lo va añadiendo al retrato compuesto ya existente, contabilizando y mostrando un valor numérico en la parte inferior derecha de la pantalla de todos los rostros que componen el retrato. El título de la obra puede aludir a la propia memoria informática, como un tipo de dispositivo que almacena datos durante un periodo de tiempo, aunque a través de la presentación de la pieza mediante un marco fotográfico y un passepartout que enmarca la pantalla digital, “la fotografía se convierte en un objeto físico”27 , y parece apuntar a la idea decimonónica del espejo con memoria en referencia al daguerrotipo. Un daguerrotipo donde el reflejo de cada individuo desaparece en la imagen colectiva de todas aquellas personas que han intentado mirarse en el espejo, produciéndose de este modo un retrato que evoluciona en el tiempo con cada persona que lo mira de frente, mutando hacia “una imagen generalizada […] que no representa a ningún hombre en concreto, sino a una figura imaginaria que posee los rasgos medios de un determinado grupo” 28 de gente, en la que los rasgos individuales se van desgastando poco a poco hasta mutar en un nuevo rostro sintético.
Lo relevante de Memory para nuestro estudio radica en la cuestión sobre cómo ciertas tecnologías de representación devienen dispositivos de control, haciendo un guiño a la evolución de la fotografía en relación al retrato, que pasó de prestar un servicio en el ámbito del ocio y el comercio —principalmente con las cartes-de-visite— a operar como un elemento de control y estudio sobre el individuo. Además, el hecho de que este dispositivo se presente camuflado en una fotografía común enmarcada, invisibiliza y disimula su función de archivo.
En la trayectoria artística de Shinseungback Kimyonghun es habitual el uso de la detección facial con distintos propósitos. Por ejemplo, en Cloud Face (2012) aplican un algoritmo de detección facial a imágenes de nubes, para crear una colección de pareidolias en distintas imágenes de nubes. En otro trabajo posterior encontramos otro ejemplo donde usan de forma simultánea la detección facial por visión artificial y promediado del rostro. Se trata del proyecto Portrait (2013), donde el sistema de detección facial es aplicado a distintas películas, para después realizar un retrato compuesto promediado de todos los rostros reconocidos por el algoritmo.
Otro artista que también ha usado con cierta frecuencia sistemas de reconocimiento facial para sus obras es el mexicano Rafael Lozano-Hemmer (1967), ya sea desde un punto de vista crítico, como en Pabellón de ampliaciones (2015), donde a través de 12 sistemas de vigilancia computarizada y el uso de algoritmos de reconocimiento facial para detectar la presencia de participantes, se proyectan en tiempo real por los distintos muros de la sala, todas las caras que el sistema es capaz de detectar; o desde una perspectiva más social, como en Nivel de confianza (2015) donde utiliza una cámara de reconocimiento facial que ha sido entrenada con los rostros de los 43 estudiantes desaparecidos de la escuela normalista de Ayotzinapa en Iguala (México), así cuando un usuario se sitúa frente a la cámara, el sistema le muestra el rostro del estudiante desaparecido que más se le parezca, mostrando el porcentaje de parecido29 .
Pero volviendo a la idea de espejo con la que trabajaban Shinseungback Kimyonghun y al tema que nos ocupa desde el presente ensayo, encontramos en Lozano-Hemmer un ejemplo a destacar en la obra interactiva Ensamblaje Redundante (2015), en la que varias cámaras de vídeo conectadas a un ordenador muestran a través de un monitor un retrato compuesto en tiempo real construido a partir de seis perspectivas simultaneas que son alineadas gracias al reconocimiento facial (Figura 6), que se realiza por medio de un software creado con la herramienta de código libre OpenFrameworks, y que permite a las cámaras detectar la presencia humana. El dispositivo muestra una imagen singular “alejada de las leyes de la simetría y de la percepción de la visión binocular”30 , tanto de un visitante como de varios, devolviendo a través de la pantalla un retrato compuesto que mezcla sus distintos rasgos faciales. Al contrario de lo que pasaba en los ejemplos anteriores, esta obra no es acumulativa, sino que realmente funciona como un espejo proyectando un desconcertante reflejo de los visitantes cuando se sitúan frente al mismo.
Por último, y con un planteamiento parecido al anterior ejemplo, resulta apropiada la serie de obras realizadas por el turco Ali Miharbi (1976) bajo el título Delegations (2007-2008). Tal y como pasaba en la obra de Lozano-Hemmer, cuando un espectador se sitúa frente a la pantalla de Delegations (Figura 7), percibe una imagen procesada en tiempo real de su rostro, pero en este caso, la imagen procesada es construida utilizando la combinación de rasgos faciales extraídos estadísticamente de los miembros de los parlamentos del país donde se exhibe la obra31 . Miharbi utiliza el procedimiento del eigenface para reconstruir mediante algoritmos la cara del espectador como si fuera uno de esos miembros, creando un simple guiño retórico en el que el espectador se convierte de forma simulada en uno más de los gobernantes de su país.
Tanto en el ejemplo de Lozano-Hemmer como en el trabajo de Miharbi se produce un salto formal con respecto a las obras anteriormente comentadas, que destaca por el hecho de que la construcción del rostro se realiza en tiempo real. Es decir, el retrato sintético que surge de promediar uno o varios rostros detectados de forma automática por visión artificial, solamente se produce durante el tiempo que el espejo detecta la presencia de personas. Si para Bertillon y Galton la fotografía es el documento donde cristalizan sus procedimientos, en estos casos la imagen fotográfica —en un sentido tradicional— desaparece por completo, siendo sustituida por la pantalla en tiempo real, un tipo de pantalla que nace con el radar y es propia de la vigilancia militar, y que produce la imagen a través de una exploración secuencial 32 mostrando cualquier movimiento o cambio en el individuo y adquiriendo “un estatuto comparable al de la sorpresa”33 .
5. Conclusión
Resulta incuestionable que el uso de herramientas que operan con técnicas de detección y reconocimiento facial pueden agilizar ciertas operaciones que realizamos cotidianamente. El empleo del reconocimiento facial por visión artificial es indisociable del medio fotográfico, pues tal y como hemos visto siempre necesita de un dispositivo óptico para interpretar un objeto real o directamente de imágenes digitales que son procesadas por el sistema, por lo que el consumo de estas herramientas implica una contribución involuntaria que genera un rastro fotográfico que acaba formando extensas bases de datos.
Este gran banco de retratos fotográficos cumple una doble función, que de algún modo hemos visto reflejada en los distintos trabajos artísticos que se han comentado. Por un lado sirve para entrenar y mejorar los diferentes sistemas de detección facial, para operar en sistemas donde son las máquinas creadas por los humanos las que observan a los propios humanos, adquiriendo comportamientos no siempre predecibles, y alertándonos sobre el riesgo que conlleva asomarnos a algunos espejos que, o bien capturan nuestra imagen para introducirla en archivos de distinta índole, o nos devuelven un reflejo distorsionado en forma de retrato sintético en lugar de un reflejo mimético del rostro. Un retrato que no se corresponde con un sujeto concreto y que representa una identidad híbrida que se difumina en la falsa imagen de la pantalla, creada a partir de la visión artificial de la máquina que interpreta a través de algoritmos el mundo real.
Por otra parte, este rastro fotográfico deviene un archivo para la identificación y el control del individuo. Así, otros proyectos artísticos indagan en la materialización del catálogo de rostros más amplio jamás imaginado, visibilizando un gran archivo en ascenso que se amplía por el trabajo de las máquinas para acabar sintetizándose en forma de rostro genérico, haciendo patente el sueño galtoniano donde los individuos solo importan desde el punto de vista de los datos y la estadística.
En cualquier caso cabe destacar una cuestión que aflora sobre esta nueva naturaleza de la imagen y el rostro sintético creado con herramientas de visión artificial, y es la referida a la conversión de la imagen tradicional, es decir, aquella imagen visible —analógica o digital— creada por humanos para los humanos, en otro tipo de imagen que opera en forma de datos, realizada por máquinas para las máquinas34 en procesos donde los propios humanos son prescindibles. Como ya hemos señalado, los sistemas computarizados producen abstracciones matemáticas de las imágenes que están analizando, como los eigenfaces, en función del tipo de metadatos que el algoritmo está tratando de leer, con resultados donde las imágenes ya no están hechas para ser miradas sino para que nos miren.
En conclusión, el uso de la visión artificial para la representación de un rostro sintético en la práctica artística pone el punto de atención sobre diversas cuestiones. En algunos casos se rescata el retrato compuesto —con toda la carga simbólica que éste arrastra— del ámbito científico donde se desarrolló para insertarlo en la larga tradición del retrato artístico, visibilizando un individuo con unas características novedosas que, tanto si pertenece a una colectividad representada por medio de un rostro genérico, como si se refiere a un sólo sujeto encarnado por distintas vistas simultáneas de su rostro, carece de corporeidad, visualizándose de forma efímera a través de la pantalla. Por otro lado, el interés se encuentra en las propias tecnologías de representación usadas en cada caso, que por lo general suelen ser dispositivos creados para el control y la vigilancia, pero que desde la práctica artística se adoptan y se ajustan para unas necesidades concretas, aprovechando sus características para ponerlas en práctica desde un punto de vista lúdico, o desde una perspectiva crítica, evidenciando su capacidad invisible de control.
Bibliografía
ALTUNA, B., “El individuo y sus máscaras”, Ideas y Valores, núm. 140, pp. 33-52 Universidad Nacional de Colombia Bogotá, Colombia, 2009.
BATCHEN, G., “Aterrador fantasma de antiguo esplendor: Qué es la fotografía”, en GREEN, D. (ed.), ¿Qué ha sido de la fotografía?, Barcelona, Gustavo Gili, 2007.
BODEN, M.A., EDMONDS, Ernest A., “What is generative art?”, Digital Creativity, 20:1-2, 2009.pp. 21-46.
BRADSKY, G.; KAEHLER, A., Learning OpenCV, Sebastopol, O’Reilly, 2008.
BRUCE, V.; GREEN, P.R., Percepción visual. Manual de fisiología, psicología y ecología de la visión, Barcelona, Paidós, 1994.
GALTON, F., “Personal identification and description”, The Journal of the Anthropological Institute of Great Britain and Ireland, Vol. 18, 1989, pp. 177-191.
GALTON, F., “Retratos compuestos”, en NARANJO, J. (ed.), Fotografía, antropología y colonialismo (1845-2006), Barcelona, Gustavo Gili, 2006.
KEMBER, S., “Ubiquitous photography”, Philosophy of Photography, Volume 3 (2), 2012, pp. 331–348.
LE BRETON, D., Rostros. Ensayo antropológico, Buenos Aires, Letra Viva, 2010.
LEVIN, G., "Computer Vision for Artists and Designers: Pedagogic Tools and Techniques for Novice Programmers", Journal of Artificial Intelligence and Society, Vol. 20.4, Springer Verlag, 2006.
MANOVICH, L., El lenguaje de los nuevos medios de comunicación. La imagen en la era digital, Barcelona, Paidós, 2005.
MAXWELL, A., Picture imperfect: Photography and Eugenics, 1870-1940, Brighton, Sussex Academic Press, 2010.
SEKULA, A., “El cuerpo y el archivo” en PICAZO, G. et al. (eds.), Indiferencia y singularidad. La fotografía en el pensamiento artístico contemporáneo. Barcelona, Gustavo Gili, 2003.
TAGG, J., El peso de la representación, Barcelona, Gustavo Gili, 2005.
VIRILIO, P., La máquina de visión, Madrid, Cátedra, 1998.
1 Aunque también se puede utilizar “visión por computadora”, que es una traducción literal del término original del inglés computer vision, durante este artículo se hace uso de “visión artificial”.
2 LEVIN, Golan, "Computer Vision for Artists and Designers: Pedagogic Tools and Techniques for Novice Programmers". Journal of Artificial Intelligence and Society, Vol. 20.4, Springer Verlag, 2006, pp. 468-470.
3 LE BRETON, David, Rostros. Ensayo antropológico, Buenos Aires, Letra Viva, 2010, p. 39.
4 SEKULA, Allan, “El cuerpo y el archivo” en PICAZO, Glòria et al. (eds.), Indiferencia y singularidad. La fotografía en el pensamiento artístico contemporáneo. Barcelona, Gustavo Gili, 2003, p. 140.
5 TAGG, John, El peso de la representación, Barcelona, Gustavo Gili, 2005, p. 12.
6 LE BRETON, Rostros…, p. 46.
7 MAXWELL, Anne, Picture imperfect: Photography and Eugenics, 1870-1940, Brighton, Sussex Academic Press, 2010, pp. 64-65.
8 Ibídem, pp. 64-65.
9 GALTON, Francis, “Personal identification and description”, The Journal of the Anthropological Institute of Great Britain and Ireland, Vol. 18, 1889, p. 191.
10 Ibídem, p. 181.
11 SEKULA, “El cuerpo…”, p. 149.
12 GALTON, Francis, “Retratos compuestos”, en NARANJO, Juan (ed.), Fotografía, antropología y colonialismo (1845-2006), Barcelona, Gustavo Gili, 2006, p. 65.
13 BRADSKY, Gary; KAEHLER, Adrian, Learning OpenCV, Sebastopol, O’Reilly, 2008, p. 2.
14 Ibídem, p. 1.
15 Aunque se suele usar el término en inglés, se refiere al “aprendizaje automático” o “aprendizaje de máquinas”.
16 BRUCE, Vicki; GREEN, Patrick R., Percepción visual. Manual de fisiología, psicología y ecología de la visión, Barcelona, Paidós, 1994, p. 543.
17 Ibídem, p. 279.
18 KEMBER, Sarah, “Ubiquitous photography”, Philosophy of Photography, Volume 3 (2), 2012, p. 341.
19 En las dos últimas décadas numerosos artistas han utilizado el promedio de imágenes a través de distintas metodologías y perspectivas, pero con resultados muy cercanos entre sí. Cabe destacar el trabajo de Jason Salavon, Corinne Vionnet, Jason Shulman, Alejandro Almaraz, Jim Campbell, Claire Hentschker y Megan Gould.
20 SIMÓ, Fran, “He soñado con un ser humano”. Disponible online en http://fransimo.info/blog/2012/09/13/i-dreamed-about-a-human-being/ (Fecha de consulta: 30-04-2018)
21 Ibídem, p. s/n.
22 Ibídem, p. s/n.
23 GALTON, “Retratos…”, p. 66.
24 Disponible online en http://contact-sheets-idahb.fransimo.info (Fecha de consulta: 30-04-2018)
25 ALTUNA, Belén, “El individuo y sus máscaras”, Ideas y Valores, núm. 140, Universidad Nacional de Colombia Bogotá, Colombia, 2009, p. 34.
26 BODEN, Margaret A.; EDMONDS, Ernest A., “What is generative art?”, Digital Creativity, 20:1-2, 2009, p. 29.
27 BATCHEN, Geoffrey, “Aterrador fantasma de antiguo esplendor”: Qué es la fotografía”, en GREEN, David (ed.), ¿Qué ha sido de la fotografía?, Barcelona, Gustavo Gili, 2007, pp. 25-26.
28 GALTON, “Retratos…”, p. 65.
29 LOZANO-HEMMER, Rafael, “Nivel de confianza”. Disponible online en: http://www.lozano-hemmer.com/texts/manuals/nivel_de_confianza_specs.pdf (Fecha de consulta: 30-04-2018).
30 LOZANO-HEMMER, Rafael, “Redundant Assembly”. Disponible online en http://www.lozano-hemmer.com/redundant_assembly.php (Fecha de consulta: 30-04-2018).
31 MIHARBI, Ali, “Delegations”. Disponible online en http://www.alimiharbi.com/work/delegations/ (Fecha de consulta: 30-04-2018).
32 MANOVICH, Lev, El lenguaje de los nuevos medios de comunicación. La imagen en la era digital, Barcelona, Paidós, 2005, p. 151.
33 VIRILIO, La máquina…, p. 83.
34 Sobre este tema consultar el artículo: PAGLEN, Trevor, “Invisible Images (Your Pictures Are Looking at You)”. Disponible online en http://brewminate.com/invisible-images-your-pictures-are-looking-at-you/ (Fecha de consulta: 30-04-2018).