PROCESOS DE CLASIFICACIÓN SUPERVISADOS COMO HERRAMIENTA DE MONITOREO DEL PATRIMONIO CULTURAL EDIFICADO

Verónica Heras

Universidad de Cuenca, Facultad de Arquitectura - Proyecto Ciudad Patrimonio Mundial
Universidad del Azuay, Facultad de Diseño, Arquitectura y Artes
Juan Carlos Briones, Edison Sinchi
Universidad de Cuenca, Facultad de Arquitectura


Resumen:
El Centro Histórico de Santa Ana de los Ríos de Cuenca fue incorporado en 1999 a la Lista del Patrimonio Mundial de la UNESCO. Sin embargo, la ausencia de políticas de conservación pone en peligro su inscripción. Si bien han existido diferentes intentos, no se ha logrado mejorar la gestión y control de este patrimonio. Esta investigación propone utilizar un método de clasificación supervisada, conocido como Máquinas de Vectores de Soporte (SVM), para determinar los elementos patrimoniales que requieren ser monitoreados a una escala territorial, como una alternativa que pueden ser un importante paso hacia un manejo organizado y expedito de su información patrimonial.

Palabras clave: monitoreo, clasificación supervisada, gestión, patrimonio edificado.
           
Abstract:
The Historic Center of Santa Ana de los Ríos de Cuenca was incorporated in 1999 to the UNESCTO World Heritage List. However, the absence of conservation policies has led to the lost of the heritage values ​​on which the listing criteria of Cuenca are based. In this respect, this research proposes to use a supervised classification method known as Support Vector Machines (SVM) to determine heritage elements that need to be monitored at a territorial scale. The results have shown a real possibility to control different elements accurately with a low computational load.

Key Words: Monitoring, supervised classification, heritage management, cultural heritage

* * * * *

Introducción

Antecedentes

La ciudad de Cuenca, ubicada en la sierra sur de Ecuador, a 2500 m.s.n.m., posee altas cualidades paisajísticas y arquitectónicas, que le han hecho merecedora del reconocimiento como Patrimonio Cultural de la Humanidad 1. En ella conviven armónicamente diferentes estilos y tipologías arquitectónicas, manifestadas de múltiples maneras. Así por ejemplo, variados tonos y matices de las cubiertas de teja que encierran perimetralmente patios coloniales tradicionales, arreglados en forma de huertos y jardines.
Sin embargo, el rápido desarrollo de las urbes latinoamericanas en el último siglo, ha amenazado a este tipo de características, sobre todo, por el cambio de uso de suelo, propiciado para satisfacer la creciente demanda del sector económico, interesado en la producción de servicios, que ha tenido como consecuencia la alteración de la funcionalidad y tipología original de las edificaciones. Estos escenarios afectan al patrimonio cultural edificado y vulneran los actuales procesos de control y gestión patrimonial, llevados a cabo por las entidades encargadas de su protección y conservación. 
En este contexto y en el marco de la línea de investigación “Conservación del Patrimonio Edificado”, de la Facultad de Arquitectura y Urbanismo de la Universidad de Cuenca, buscamos establecer lineamientos metodológicos que permitan controlar y monitorear la ciudad patrimonial y sus recursos de una manera eficaz y eficiente; y dotar de herramientas útiles y prácticas, sustentadas en el uso de las nuevas tecnologías de la información. El objetivo fundamental de la investigación es la automatización en la detección de los diferentes elementos que componen el paisaje urbano de un entorno patrimonial y que resultan identificables desde una vista aérea, esto es: cubiertas, áreas verdes y red vial.

Alcance

La presente investigación busca la detección automatizada de elementos patrimoniales identificables en una fotografía aérea, mediante una técnica de clasificación supervisada. Posteriormente, al replicar esto en imágenes de diferentes etapas históricas, se podrá advertir los cambios suscitados en tales periodos de tiempo, que evidenciarán signos de alteración más profunda en el paisaje urbano.
Dicho lo anterior, para el desarrollo y aplicación de la metodología, se ha seleccionado como muestra representativa de la problemática el sector del Barranco, ubicado entre las calles Benigno Malo y Tarqui. En la zona se identificaron claramente los elementos patrimoniales que se desean monitorear, a través de dos niveles de categorización: la primera, engloba, de manera general, cubiertas, áreas verdes y red vial; la segunda, se refiere a las cubiertas y sus diferentes texturas materiales entre las que destacan la teja artesanal, industrial, fibrocemento y vidrio.
La clasificación se realizó utilizando el algoritmo de Maquinas de Vectores de Soporte (Supported Vector Machines – SVM) y la utilización de diferentes funciones kernel 2. Posteriormente, se evaluó la calidad de la clasificación, utilizando una matriz de confusión con la que se calculó el desempeño del algoritmo. frente a las muestras utilizadas para entrenar el modelo de predicción, permitiendo realizar los cálculos del índice kappa que establece el grado de acuerdo que existe entre dos observaciones independientes.
La imagen aérea sobre la cual se trabajó corresponde a julio del 2017 proveniente de la documentación  realizada con un UAV 3. Por su alta resolución (2.5 cm/píxel) es posible obtener un nivel de detalle de los objetos que provoca una clasificación muy segmentada. Por tal motivo fue necesario simplificar este tipo de detalles por medio de una operación conocida como 'apertura morfológica' que permitió que los objetos menores a 25 cm de longitud fueran asignados a las clasificaciones adyacentes de mayor tamaño.

Metodología

Clasificación

En primer lugar, se definieron según su materialidad, los elementos a ser clasificados, cuyo detalle se muestra en la Tabla 1.
La imagen utilizada se adquirió a través de un UAV, en una resolución espacial de 2.5 cm por pixel, con características muy detalladas de la geometría y texturas, para cada uno de los elementos que conforman las cubiertas. Este estudio propuso utilizar el algoritmo de clasificación SVM con diferentes tipos de funciones, estimando el porcentaje de acuerdo OA y el índice kappa con el objetivo de comparar el desempeño de cada algoritmo.
Los algoritmos de clasificación supervisada requieren de un conjunto de muestras positivas para cada uno de los elementos, estas muestras se conocen como regiones de interés (ROI) que son polígonos cuya identificación se corresponden con la columna material de la Tabla 1.
Los modelos de entrenamiento se consideraron ajustados hasta obtener un índice kappa superior a k = 0.9. El valor del índice kappa permite medir el acuerdo, únicamente, entre dos observadores al clasificar entre categorías que son mutuamente excluyentes, donde un valor k = 1 indica que existe un acuerdo total entre los dos observadores 4.
Por otra parte, la Tabla 2 presenta la matriz de confusión de la cual se desprenden los cálculos posteriores:
      
Para obtener el índice kappa, primero se calcula el porcentaje de acuerdo (OA) (Ecuación 1), que es a su vez una medida de precisión de la clasificación de elementos. El cálculo se lo realiza sumando las muestras de la diagonal de la matriz de confusión, en donde ambos observadores coinciden en su clasificación para el total de observaciones.
Donde: N es el número de clases y xij es el número de muestras en cada clase.
Se calcula también la probabilidad de azar (P) (Ecuación 3) de cada observador en cada una de las clases, de modo que, si existen dos observadores A y B, se deberán previamente calcular las probabilidades individuales (p) de cada uno (Ecuación 2).
Donde: N es el número de clases y xij es el número de muestras en cada clase
Con estos valores se calcula finalmente el índice kappa de Cohen, aplicando:
El primer paso de la metodología fue utilizar el SVM, un algoritmo de predicción de muestras, en donde, dado un conjunto de muestras iniciales, fue posible predecir a qué clase pertenecería la siguiente que ingresa al conjunto. La precisión de la clasificación depende de la separación que exista entre cada clase, dado un espacio p-dimensional; sin embargo, estos clasificadores buscan los márgenes de separación con funciones lineales, lo cual posee limitaciones cuando existen múltiples clases y el margen es reducido, dada la similitud de las muestras 5. A pesar de esta limitación, los resultados son bastante aceptables, en función del tiempo de procesamiento y la limitada cantidad de regiones de interés con las que se contó para realizar el entrenamiento y clasificación.
Los resultados obtenidos para cada uno de los diferentes KM (Kernel Methods) 6 utilizados presentamos en la siguiente tabla (Tabla 3): 
El resultado polinomial presentó los mejores resultados, con un 71% de precisión.

Regularización

El siguiente proceso consiste en homogeneizar las clases que se encuentran clasificadas, sin embargo, en un radio de cierto número de pixeles, no representan la clase de la mayoría de los pixeles a su alrededor7 .
En las figuras 2 y 3 se observa el resultado obtenido luego de homogeneizar la clasificación para las clases predominantes en un radio de 1.5 m,  en donde se logró reducir la sobre-segmentación y obtener una clasificación más precisa.   

Resultados

Este procedimiento permitió estimar el área de ocupación en la manzana para cada uno de los elementos observados. Estos valores presentamos a continuación (Tabla 4).
Los resultados obtenidos poseen un 68% a 71% de precisión, considerando el grado de acuerdo existente entre dos observaciones independientes.

Conclusiones

El SVM, conocido como 'Máquinas de Vectores de Soporte', aplicado sobre imágenes de alta resolución, obtuvo una clasificación y un grado de acuerdo sobre el 71% del total de muestras, para todas las funciones utilizadas; en este sentido, la función polinomial presentó el mayor desempeño. Para obtener un modelo de entrenamiento más preciso, con diversas clases, fue necesario aumentar el número regiones de interés para cada elemento, así como, el número de clases que son muy similares, como por ejemplo: el zinc, el fibrocemento, el hormigón y el adoquín. Al disminuir las clases a grupos de cubiertas, vegetación, e infraestructura, el clasificador obtuvo una precisión del 80%.
El procesamiento computacional, al utilizar este tipo de clasificadores, es menos intensivo, en comparación con otros algoritmos como las redes neuronales. La cantidad de muestras utilizadas fueron mínimas, apenas 5 o 7 muestras para cada una de las clases.
Debido a la alta resolución de las imágenes se clasificaron elementos muy pequeños que  introdujeron ruido al archivo raster. Para simplificar esto, se utilizó el algoritmo mayority vote y se logró obtener una clasificación final más clara, con una buena aproximación de la geometría original de cada elemento clasificado.
La clasificación de cubiertas de vidrio fue la que presentó menor precisión, debido a la traslucidez de este elemento. Tal situación puede mitigarse incluyendo otros parámetros de evaluación como la altura y reglas contextuales, aspectos a ser abordados en futuras investigaciones. El presente estudio permitió comprobar la utilidad y factibilidad del SVM en la resolución efectiva de problemas relacionados con el control del patrimonio edificado de la ciudad de Cuenca. Esta es una solución que podría ser aplicada de forma eficiente, sin que represente un mayor costo en su ejecución y, cuyos resultados finales favorecen a los procesos de control y monitoreo que deben llevarse a cabo en todo sitio patrimonial.

Bibliografía

BOYER, Robert; MOORE, J Strother; “MJRTY - A Fast Majority Vote Algorithm”, En BOYER, Robert, Automated reasoning, Kluwer Academic Publishers and copyright holders,1991.
COHEN, Jacob, “A coefficient of agreement for nominal scales”, Educational and Psychological Measurement, vol. 20, nº1, 1960.
DUDA, Richard; HART, Peter; STORK, David. Pattern Classification. Canadá,John Wiley & Sons, 2012, pp. 49-51.

MULLER, K., “An introduction to kernel-based learning algorithms”, IEEE Transactions on Neural Networks, vol. 12, nº2, 2001.

VAPNIK, Vladimir, The nature of statistical learning theory, New York, Springer Science & Business Media, 2013, pp. 190-193.

1 Según resolución de la UNESCO, en sesión celebrada en Marruecos, 01 de Diciembre de 1999.

2 VAPNIK, Vladimir, The nature of statistical learning theory, New York, Springer Science & Business Media, 2013, pp. 190-193.

3 Comúnmente conocido como dron o  vehículo aéreo no tripulado. De sus siglas en inglés (Unmanned Aerial Vehicle)

4 COHEN, Jacob, “A coefficient of agreement for nominal scales”, Educational and Psychological Measurement, vol. 20, nº1, 1960.

5 DUDA, Richard; HART, Peter; STORK, David. Pattern Classification. Canadá,John Wiley & Sons, 2012, pp. 49-51.

6 MULLER, K., “An introduction to kernel-based learning algorithms”, IEEE Transactions on Neural Networks, vol. 12, nº2, 2001.

7 BOYER, Robert; MOORE, J Strother; “MJRTY - A Fast Majority Vote Algorithm”, En BOYER, Robert, Automated reasoning, Kluwer Academic Publishers and copyright holders,1991.

logo universidad malagalogo asri