Georreferenciamento: o que é, uso e ferramentas

Imagine que você está analisando uma base de dados com o intuito de determinar a melhor localização para a construção de um pet shop. Você já analisou diversas variáveis em um dataset tabular, mas reparou que não haviam duas colunas muito importantes para o problema, a latitude e a longitude dos possíveis concorrentes. Tudo fez sentido, seria muito interessante coletar essas informações e representá-las em um mapa para calcular a distância dos empreendimentos de pontos de transporte público e do possível local do pet shop, por exemplo. Essa representação das informações em um mapa é conhecida como georreferenciamento.

O que é georreferenciamento?

O processo de atribuir coordenadas geográficas a objetos ou dados vinculando essas informações a um sistema de coordenadas é o que chamamos de georreferenciamento. Se fizermos essa atribuição, fica possível representar as informações em um mapa para identificar a posição exata de cada objeto ou dado no espaço.

Esse tema é fundamental em muitos campos de estudo e aplicações, como planejamento urbano, agricultura, meio ambiente, logística, telecomunicações, monitoramento de recursos naturais, entre outros. Ele auxilia na análise de padrões geográficos e na tomada de decisões, fornecendo informações detalhadas sobre a distribuição espacial dos dados e permitindo a compreensão das relações entre diferentes elementos no espaço geográfico.

O que acontece quando os dados não são georreferenciados?

Quando os dados não são georreferenciados, eles não estão vinculados a um sistema de coordenadas geográficas específico e, portanto, não podem ser localizados com precisão no espaço geográfico.

Um sistema de coordenadas geográficas (SIG) é um método de referência utilizado para representar e localizar pontos na superfície terrestre, utilizando coordenadas que são expressas em graus de latitude e longitude. Nesse sistema, o planeta é dividido em paralelos e em meridianos.

O grau zero no eixo horizontal é dado pelo Meridiano de Greenwich e o grau zero no eixo vertical é dado pela linha do Equador. Partindo da linha do Equador, podemos traçar uma série de círculos menores, paralelos a essa linha, e esses círculos são o que chamamos de paralelos. Já os meridianos são círculos perpendiculares à linha do Equador.

Assim, a latitude é uma medida geográfica que indica a posição norte ou sul de um ponto na Terra em relação ao Equador. Já longitude é a posição à oeste ou leste em relação ao Meridiano de Greenwich.

Como georreferenciar dados?

No georreferenciamento queremos associar informações a uma localização geográfica. Dependendo do problema que você está lidando esse processo pode variar. Você pode coletar dados usando um GPS, nesse caso, as coordenadas de latitude e longitude são registradas automaticamente e as informações já estarão georreferenciadas. Já se você tiver um endereço ou localização específica, pode usar um serviço que chamamos de geocodificação. Assim, é possível converter esses endereços em latitude e longitude.

Quais são as ferramentas e técnicas comuns usadas para georreferenciar dados?

Dois softwares muito famosos nessa área são o QGIS e o ArcGIS. Eles permitem que esse processo de associação de objetos, imagens de satélites e mapas seja feito facilmente. Eles possibilitam a conexão com bancos de dados e o uso de linguagens de programação, como a linguagem Python, através de APIs. Entretanto, se você vem do mundo da Ciência de Dados, talvez ache interessante utilizar uma biblioteca Python para fazer a análise e georreferenciamento de dados.

Um ótimo exemplo de biblioteca que permite o trabalho com dados geoespaciais é a GeoPandas. Com essa biblioteca, trabalhamos com GeoDataFrames. Esse tipo de DataFrame funciona como uma extensão dos DataFrames Pandas, permitindo operações entre objetos geométricos espaciais. A partir dos GeoDataFrames também é possível gerar mapas relacionados aos dados ali presentes de forma direta.

Pysal é uma biblioteca focada em Ciência de Dados e análise geoespacial com módulos voltados para a estimativa de relação entre diferentes informações e predição. Já a biblioteca Folium é focada na visualização das informações geográficas. Ela aproveita os recursos da biblioteca leaflet.js para a construção de mapas interativos. Por fim, uma biblioteca menos conhecida, mas bastante poderosa, é a PyGMT, que tem uma grande quantidade de recursos para a construção de mapas extremamente detalhados.

Como são organizados os dados geoespaciais?

Para representar as informações em um mapa, usamos vetoriais ou dados raster. Dados vetoriais incluem pontos, linhas, polígonos e outras informações de descrição sobre um local. Esses tipos de dados são vantajosos pela precisão na representação de formas geográficas complexas e por ocuparem pouco espaço na memória. Além disso, temos a possibilidade de editar esses dados.

Dados raster consistem de uma matriz de linhas e colunas com informação associada a cada célula da matriz. Dessa forma, esses dados são frequentemente usados para representar dados que variam continuamente em uma área. Imagens de satélite de uma cidade que contém informação do clima em cada célula são um exemplo de dados raster.

Quais são os diferentes sistemas de coordenadas e como eles são usados em georreferenciamento?

Embora tenhamos mencionado bastante o sistema de coordenadas geográficas, há outros sistemas de coordenadas. Quando trabalhamos nessa área, é comum ouvir sobre o termo datum. O datum é dado por elipsóide, uma esfera de diâmetro maior no Equador e mais achatada nos pólos, que descreve o tamanho e a forma do planeta. Além disso, ele fornece um ponto de partida para estabelecer um sistema de coordenadas geográficas.

Existem dois tipos principais de datums: os geocêntricos e os locais ou geodésicos. O WGS84 é um exemplo de datum geocêntrico, ele é o padrão atual para mapeamento e navegação GPS. Os datums locais estão associados a uma região geográfica específica e foram criados para fornecer a maior precisão possível. Um exemplo é o SAD69 (South American Datum 1969), que foi usado como padrão no Brasil antes da adoção do SIRGAS2000, um datum geocêntrico. A figura abaixo obtida na página do NOAA mostra diferentes Datums. O Clarke 1866 é um exemplo de Datum local com o centro do elipsóide de aproximadamente 236 metros do centro do Datum GRS 80, um Datum Global.

Datums globais em comparação com a Terra. São mostrados os datums GRS 80 e WGS 84, ambos globais. Também é mostrado o datum Clarke 1866 que é um exemplo de datum local. Por fim, é mostrado o geóide que corresponde a superfície dos oceanos.

Em alguns casos de escala global, também podemos usar sistemas de coordenadas cartesianas. Nesse caso, usamos um sistema 3D para representar a posição de um ponto em relação ao centro da Terra.

Esfera 3D cortada por 3 eixos X,Y e Z perpendiculares. Sobre a esfera temos o Meridiano de Greenwich e a linha do Equador.

Levando em conta a forma 3D da Terra, também é comum vermos referências de altitude de um ponto na superfície da Terra. Essa altitude pode ser chamada de altura geométrica, quando é medida em relação ao elipsóide, uma representação matemática da forma da Terra, com diâmetro maior no Equador e mais achatada nos pólos. Já quando a medida é feita em relação ao geóide, chamamos essa altitude de ortométrica. O geóide é uma superfície equipotencial do campo gravitacional da Terra e coincide aproximadamente com o nível médio do mar.

Ilustração mostrando como a altitude geométrica e ortométrica são calculadas. A geométrica é obtida a partir do elipsóide e a ortométrica a partir do geóide.

Projeções

A representação da Terra de forma 3D é pouco comum. Normalmente precisamos representar a figura da Terra em um mapa ou na tela do computador que são planos bidimensionais. Cada projeção tem vantagens e desvantagens, e a escolha de qual projeção usar depende das necessidades da análise que será realizada. Existem três tipos principais de projeções cartográficas que nos ajudam a transportar parte da superfície 3D da Terra para um mapa 2D: as cilíndricas, cônicas e as azimutais. Nas cilíndricas, a superfície da Terra é projetada em um cilindro. A projeção de Mercator é um exemplo desse tipo de projeção, bastante usada em navegação marítima. Já a Projeção Conforme de Lambert é frequentemente usada para mapas de grandes regiões que têm uma extensão maior no leste-oeste do que no norte-sul. Por fim, nas projeções azimutais, a Terra é projetada em um plano. A Projeção Azimutal Equidistante é usada para mostrar rotas aéreas.

Exemplo de projeção de uma esfera de cor verde representando a Terra. Da esquerda para a direita: projeção cilíndrica, em que a esfera está dentro de um cilindro pontilhado; no lado direito, temos o mapa resultante.

Mapa obtido em: original by NASA (sensor Terra/MODIS), modified by Mdf, Public domain, via Wikimedia Commons.

Exemplo de projeção de uma esfera de cor verde representando a Terra. Da esquerda para a direita: projeção azimutal, em que temos um disco pontilhado sobre a esfera; No lado direito, temos o mapa resultante.

Mapa obtido em: Strebe, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0, via Wikimedia Commons.

Exemplo de projeção de uma esfera de cor verde representando a Terra. Da esquerda para a direita: Projeção Cilíndrica, em que a esfera está dentro de um cone pontilhado; No lado direito temos o mapa resultante.

Mapa obtido em: Strebe, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0, via Wikimedia Commons.

No georreferenciamento, a projeção cartográfica é crucial, mas devemos ter em mente que todas as projeções distorcem de alguma forma a realidade. Algumas preservam áreas, outras preservam ângulos (conformes), e outras ainda preservam distâncias a partir de determinados pontos (equidistantes). Como mencionado anteriormente, a escolha da projeção irá depender dos objetivos da sua análise.

Como o georreferenciamento é usado para análise espacial e tomada de decisões?

O georreferenciamento pode ser usado em inúmeras áreas. No planejamento e desenvolvimento urbano, podemos planejar novas estruturas como estradas, escolas e parques. Na saúde, podemos rastrear a propagação de doenças e identificar áreas de risco onde existe aglomeração de pessoas. Também podemos usar essas ferramentas no gerenciamento de desastres e em negócios e marketing. Empresas podem analisar dados demográficos, padrões de tráfego entre outras informações para obter vantagens competitivas.

Também podemos usar técnicas de machine learning e análise de imagens para tarefas como a detecção de mudanças de uso da Terra, identificação de recursos naturais, previsão de desastres, entre outros.

E aí, curtiu? Aqui na Alura nós temos vários conteúdos voltados à Ciência de Dados e Machine Learning. Você pode iniciar no tema na Formação Python para Data Science. Esta é uma trilha de estudos completa que inicia com a linguagem Python e passa por bibliotecas como a NumPy e a Pandas.

Créditos

Conteúdo: Allan Spadini
Produção técnica: Rodrigo Dias
Produção didática: Thaís de Faria
Designer gráfico: Alysson Manso