Grupo do Inpe aprimora método para mapear uso e cobertura do solo a partir de imagens de satélite

Por Gabriel Máximo da Silva/Inpe via Fapesp

Imagens de satélite são usadas para diversos fins, entre os quais o mapeamento de uso e cobertura do solo (Lulc, na sigla em inglês). Segundo um grupo de pesquisadores do Instituto Nacional de Pesquisas Espaciais (Inpe), o uso dessas “fotografias” pode ser aperfeiçoado se esse material passar pelo crivo de experts antes de ser analisado com a ajuda de algoritmos e outras ferramentas computacionais.

A equipe publicou na revista Forests um trabalho sobre o mapeamento de uso e cobertura do solo do Estado de São Paulo. Nele, levou em conta a expertise dos cientistas na pré-seleção das imagens para classificação do uso e da cobertura do solo em seis categorias: floresta, plantação florestal, corpos d’água, áreas urbanas, agricultura e pastagem.

Due Diligence

De acordo com os dados obtidos pelo grupo, as áreas florestais concentram-se principalmente na região leste de São Paulo, predominantemente em encostas mais íngremes, respondendo por 19% da área de estudo. A pastagem e a agricultura dominam 73% da paisagem paulista, respondendo, respectivamente, por 39% e 34%. Para validar os resultados, a equipe os comparou à classificação do Projeto MapBiomas (rede colaborativa que produz mapeamento anual da cobertura e do uso da terra), obtendo uma acurácia geral de 85,47%.

“A novidade do método proposto consiste em selecionar as imagens com base nas características espectrais e temporais de classes predefinidas de Lulc. Primeiro, definimos as seis classes que seriam mapeadas no ano de 2020. Depois, analisamos visualmente suas características espectrais de variabilidade ao longo do ano, para selecionar aquelas que melhoram cada classe de Lulc, individualmente, nas imagens. Em seguida, pré-processamos essas imagens para gerar um mapa destacando cada classe de Lulc”, resume o primeiro autor do artigo, Yosio Edemir Shimabukuro, pesquisador da Divisão de Observação da Terra e Geoinformática (DIOTG) do Inpe.

Classificação

A equipe usou dois mosaicos de imagens do satélite Landsat-8 Operational Land Imager (OLI), da Nasa (agência espacial norte-americana): 379 capturadas de janeiro a junho de 2020 (final da estação chuvosa e início da seca) e 212 feitas de maio a setembro (estação seca). Com base nesses mosaicos, investigou o período temporal mais adequado para classificar cada categoria.

“Um mosaico anual – no nosso caso, de janeiro a dezembro de 2020 – ajuda a melhorar a classificação dos corpos d’água. Já para identificar as classes urbana e florestal, os melhores resultados foram alcançados com imagens de maio a setembro de 2020, que é a estação seca. Para a classificação da agricultura, utilizamos imagens de janeiro a junho de 2020, período que destaca a categoria, por ser época de cultivo”, explica Egídio Arai, coautor do artigo.

Segundo ele, o grupo começou classificando a água, que é uma tarefa mais fácil, seguida por área urbana, floresta, agricultura e, por último, as áreas de floresta plantada. “Assumimos que todas as áreas restantes estavam cobertas por pastagens.”

Classificar as florestas plantadas exigiu a utilização de imagens de maio a setembro do período de 2013 a 2020. “A diferença da floresta plantada para a permanente é justamente a temporalidade. Por isso, usamos imagens de 2013 a 2020. Sabemos que, no Estado de São Paulo, o que mais se planta é eucalipto, que tem ciclo de corte de cinco a sete anos. Assim, se eu usar imagens de um único ano, e calhar de ser justamente quando as árvores foram cortadas, não vou entender que é uma floresta plantada. Ela tem muitos ciclos de corte, então é preciso mostrar ao algoritmo que ele terá de usar muitas imagens para classificar aquele tipo de vegetação”, explica Gabriel Máximo da Silva, doutorando em sensoriamento remoto no Inpe.

As classes de uso e cobertura do solo foram categorizadas individualmente com o uso de bandas espectrais específicas, índices espectrais (resultado de operações matemáticas entre valores numéricos de pixels das bandas de uma imagem) e também imagens de fração (geradas a partir de um modelo linear de mistura espectral). O grupo empregou um algoritmo classificador conhecido como Random Forest, disponível na plataforma Google Earth Engine (GEE), para a classificação das imagens em cada classe Lulc. “Por meio de diferentes processamentos, procuramos realçar cada categoria de interesse, utilizando as bandas espectrais originais e tentando destacar cada alvo”, relata Shimabukuro.

O artigo publicado na Forests é apenas um dos resultados do projeto “Análise espaço-temporal do uso e cobertura da terra no estado de São Paulo utilizando técnicas de sensoriamento remoto”, coordenado por Shimabukuro e financiado pela FAPESP. O objetivo geral foi mapear, monitorar e analisar as mudanças no uso e cobertura da terra entre 1970 e 2020 no Estado de São Paulo, por meio de sensoriamento remoto e geoprocessamento.

Nuvens

Uma das dificuldades do uso dessas técnicas, segundo Arai, são as nuvens que encobrem, nas imagens, aquilo que se quer visualizar. De acordo com o pesquisador, mesmo restringindo o período estudado, ainda há nuvens e sombras nas imagens. Isso sem contar a dificuldade do próprio algoritmo que, mesmo sendo bastante preciso, tem seus limites.

“O algoritmo filtra as nuvens, tirando-as das imagens, e ainda leva em conta os percentis da série histórica [cada uma das partes, na divisão da amostragem em cem partes]. Assim, é possível selecionar visualmente os melhores percentis para fazer a classificação. Só que, mesmo com o filtro do algoritmo, restam nas imagens as sombras ou pedaços de nuvens, ou ainda nuvens menos espessas. O Landsat tem uma resolução temporal de 16 dias. Num período chuvoso é complicado conseguir imagens sem nuvens.”

No projeto apoiado pela FAPESP, como a intenção era avaliar um período longo, a maior cobertura é do Landsat, mas o grupo lançou mão de imagens dos outros satélites também, como Sentinel-2 MSI; Terra MODIS; PROBA-V; CBERS-4 WFI, MUX, PAN; SRTM; RapidEye; Worldview, VIIRS, entre outros. Cada um deles agrega diferentes resoluções, tanto temporais quanto espaciais.

“É possível usar imagens de todos eles, em conjunto: por exemplo, os dados do Landsat com o melhor do Sentinel-2 MSI, que é a resolução espacial, e o melhor no MODIS, que é a resolução temporal, quase diária. O Sentinel tem uma resolução espacial de 10 metros; no Landsat, ela é de 30 metros. Então, haveria mais detalhes espaciais com o Sentinel. No MODIS, a possibilidade de conseguir imagens sem nuvens é maior, por conta da resolução temporal, mas a resolução espacial dele é pobre. Então, pode-se utilizar a resolução espacial do Landsat. Eu não me lembro de ver outros trabalhos empregando vários sensores combinados para obter uma melhor classificação de uso e cobertura do solo”, ressalta Arai.

Para ler mais, acesse a reportagem na Fapesp.

Por Inpe e Fapesp, via Karina Ninni.

Veja também

Geo e Legislação

JusMapp: Spin-off da Geocracia atuará na certificação de riscos territoriais no Brasil

A JusMapp surge como uma spin-off da Geocracia para dar continuidade as atividades da primeira legaltech do Brasil focada no mapeamento de riscos territoriais. Com a JusMapp, empresas e escritórios de advocacia identificam oportunidades de negócio e acelerar seus processos de auditoria sobre riscos ambientais, minerários, fundiários e políticos. A

Agro e Ambiental

TerraClass: metade do Cerrado é vegetação natural

O Geoportal TerraClass acaba de disponibilizar ao público os dados do mapeamento de uso e cobertura da terra do bioma Cerrado. As informações, referentes a 2018 e finalizadas ano passado, apontam que 49,4% da região são compostos por vegetação natural primária; 28,9% por pastagens e 4,7% por vegetação natural florestal

Não perca as notícias de geoinformação