Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/12382
Título: Criação de plataforma de geocoding baseada em serviços Google Maps
Autor: Goldstein, Stephane
Orientador: Catita, Cristina Maria Sousa,1971-
Batista, Sandro Gonçalo da Fonseca
Palavras-chave: Geocoding
Georreferenciação
Google Maps API
Trabalhos de projecto de mestrado - 2014
Data de Defesa: 2014
Resumo: Este projeto foi realizado no âmbito de um estágio na consultora de negócios Focus BC. De acordo com as necessidades da empresa, a proposta constitui a criação de uma plataforma de georreferenciação de moradas postais em lote, utilizando o serviço de geocoding da Google Maps: a Geocoding API. A aplicação foi escrita na linguagem de programação Python, e conta com etapas de pré e pós processamento dos dados que possibilitaram aumentar a qualidade dos resultados oferecidos pelo serviço. Métricas de avaliação dos dados originais foram criadas (métricas de entrada), permitindo ajustar as expectativas quanto aos possíveis resultados, assim como estimar o esforço necessário para obtenção da precisão desejada na georreferenciação. Em seguida os dados passam por um módulo de correção e normalização de moradas, ficando prontos para serem enviados ao serviço. Sucessivos pedidos de geocoding para um mesmo registo são eventualmente feitos, alterando a estrutura da morada de acordo com um fluxo de controle específico. Como as quatro classes de precisão dos resultados atribuída pela Geocoding API não possuem um nível de detalhe suficiente no contexto dos projetos desenvolvidos pela Focus BC, foi implementado um método que classifica os resultados em sete categorias. A versão final da aplicação georreferenciou 31915 moradas provenientes de quatro fontes distintas. Uma precisão considerada aceitável foi atingida para 81.8% dos registos. A normalização e o sistema de múltiplos pedidos lograram em conjunto um aumento de 9.53 pontos percentuais na proporção de registos referenciados com precisão considerada alta (55% do total). Apesar da normalização, os resultados são influenciados pela qualidade dos dados originais, como foi possível evidenciar através das métricas de entrada. Uma verificação manual da precisão de 2% dos registos permitiu avaliar a confiança da classificação dos resultados, indicando uma precisão global de 91.72 %. No âmbito deste estudo identificaram-se algumas melhorias possíveis de serem implementadas nos processos de normalização e na atribuição de precisão. Justifica-se a necessidade de futuramente desenvolver-se uma interface web para facilitar o uso da aplicação, assim como sua adaptação a moradas e organizações territoriais de outros países.
The project hereby presented was realized in the context of an internship at the business consulting company Focus BC. Seconding the company needs, it consists in the development of a batch geocoding platform, based on the geocoding service provided by Google Maps: the Geocoding API. The application was written in the Python programming language and includes pre and post data processing operations that allowed to obtain results of better quality than those provided by the geocoding service alone. Quality metrics for the original data were developed, making possible to adjust the expectations in terms of possible achievable results during the geocoding process. Those metrics also help to estimate the amount of effort needed in order to geocode a specific set of data with a determined precision. Following this first evaluation, data undergo a correction and normalization process, making it ready to be sent to the geocoding service. By the means of an established control flow, successive geocoding requests for the same record are eventually made, but using different postal address structures. The four precision classes provided by the Geocoding API to classify the results do not have the necessary level of detail needed in the context of the projects developed by Focus BC, so a method that classifies the results within seven precision categories was implemented. The application's final version was used on the referencing of 31915 records from four different sources. A precision considered acceptable was achieved for 81.8% of those records. The normalization and multiple geocoding system altogether enabled a 9.53 percentage points increase in the proportion of addresses referenced with a precision considered high. Despite the normalization process, results greatly depend on the original data quality, as it was possible to confirm by the means of the original data metrics. A manual verification of the precision on 2% of the records allowed to evaluate the confidence of the results classification method. A global precision of 91.72% was determined. In the context of this study possibilities of improvements were identified in the normalization and results classification steps. There is also justification for future works to be considered, adapting the application to other countries addresses and territorial organization, as well as the creation of a web interface in order to improve its usability.
Descrição: Trabalho de projeto de mestrado em Sistemas de Informação Geográfica, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2014
URI: http://hdl.handle.net/10451/12382
Designação: Mestrado em Sistemas de Informação Geográfica
Aparece nas colecções:FC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
ulfc110303_tm_Stephane_Goldstein.pdf9,71 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.