Predicción, seguimiento y control de variables biofísicas en ecosistemas forestales mediante la utilización de sensores remotos y Redes Neuronales Artificiales (RNA) (CARBONIA)

De las diferentes tecnologías de teledetección las más utilizadas para cartografiar la cubierta vegetal son las técnicas que utilizan la clasificación de imágenes de satélite de sensores multiespectrales. La clasificación de imágenes multiespectrales es un proceso complejo que puede estar afectado por múltiples factores. Consiste básicamente en un proceso de reconocimiento de patrones, existiendo una gran cantidad de variedades y tipos.

Frecuentemente para la identificación de las cubiertas vegetales a partir de clasificación de datos de teledetección, se han utilizado los denominados índices de vegetación, imágenes resultantes de combinaciones algebraicas entre las diferentes bandas multiespectrales de la imagen. En la actualidad, existen importantes avances en estudios que han establecido relaciones entre los índices de vegetación y algunos parámetros biofísicos como el coeficiente de cultivo, la evapotranspiración, la fracción de cobertura, así como otros parámetros obtenidos a partir de la reflectancia en superficie de la cubierta como son el albedo, radiación fotosintéticamente activa absorbida, la temperatura superficial etc.

Utilizando los índices de vegetación o los métodos clásicos para procesar los datos de teledetección se obtiene fácilmente información sobre la organización horizontal de las cubiertas vegetales. Sin embargo, la mayoría de los sistemas clásicos de teledetección no proporcionan datos directos sobre la rugosidad o la distribución vertical de los elementos de cubierta que son fundamentales para conocer las existencias de biomasa (y por lo tanto de carbono almacenado) en los ecosistemas forestales. La utilización de sensores activos como el LiDAR permite solventar este problema y enriquecer la información de composición de las cubiertas vegetales con información de la estructura de la vegetación, altura y distribución vertical y horizontal de los diferentes componentes.

El trabajo con algoritmos de aprendizaje automático (Random Forest) parte de un conjunto de datos de entrada suficientemente significativo que permite mediante diferentes algoritmos de aprendizaje “entrenamiento” mediante arboles de decision. El objetivo del presente proyecto es diseñar algoritmos de aprendizaje automático capaces de aprovechar datos provenientes de teledetección con información LiDAR para estimar un amplio espectro de variables biofísicas, como el volumen de madera, la altura de la masa, el área basimétrica, la producción de Madera y el Carbono fijado por las masas vegetales.

El proyecto se estructurará en las siguientes etapas:

  • Análisis y selección de sensores y fuentes de información: En esta fase se ha realizado un análisis comparativo de las distintas fuentes de información satelital y LiDAR que puedan ser potencialmente útiles para cumplir los objetivos del proyecto. Para cada una de las fuentes disponibles se han analizado los costes por unidad de superficies, su resolución, el proceso y preparación de las imágenes (calibraciones geométricas, atmosféricas, clasificación de la nube de puntos LiDAR, etc…) y los costes y tiempos asociados a esos procesos de preparación de los datos.
  • Selección de algoritmos de aprendizaje automatico: Partiendo de las fuentes de información seleccionadas se elaborarán desarrollos para el diseño de distintos algoritmos de aprendizaje automatico. Se trata de seleccionar aquellos capaces de trabajar con las fuentes existentes de información disponibles con niveles de precisión acordes a las exigencias de los distintos fines perseguidos. En esta fase se ha trabajado con dos grandes tipos algoritmos dependiendo de cuál sea su objetivo: Clasificación supervisada y predicción-cuantificación variables forestales.
  • Diseño de herramienta de cálculo para la cuantificación de biomasa y carbono presente y futura en ecosistemas forestales: en esta fase se ihan integrado los algoritmos seleccionados (Random Forest), con los datos satelitales para generar los productos finales de cuantificación de forma espacialmente explícita de carbono almacenado, biomasa o crecimiento o evolución de las masas forestales. Se trata de una herramienta versátil que permite al usuario partir de distinta información base y utilizar distintos factores de emisión en función de los requerimientos del proyecto.
  • Proyecto piloto de validación de la herramienta generada: en esta fase se ha puestoa prueba la herramienta generadas en diferentes proyectos pilotos seleccionados por su interés ambiental y forestal dentro del rango de aplicabilidad de las redes neuronales diseñadas. Ha sido necesario disponer para esta fase de muestras independientes que permiten validar los resultados y por tanto también calcular la incertidumbre en las estimaciones para cada uno de los productos generados. En caso de la clasificación será necesarias muestras de campo que permitan generar una matriz de confusión para cada una de las cartografías generadas dentro de las diferentes zonas piloto.
  • Presentación de productos incluida la herramienta de Software el proyecto se ha difundido durante su ejecucion en foros de catacter nacional e internacional tales como el CONAMA 2014.