Universidade de Lisboa Repositório da Universidade de Lisboa

Repositório da Universidade de Lisboa >
Faculdade de Ciências (FC) >
FC - Dissertações de Mestrado >

Please use this identifier to cite or link to this item: http://hdl.handle.net/10451/4586

Title: Data quality - entidades
Authors: Pedro, Ana Teresa Gonçalves
Advisor: Correia, Luís Miguel Parreira e, 1959-
Cosme, Tiago Dias
Keywords: Qualidade de dados
Informação do cliente
Limpeza de dados
Investigação de dados
Auditoria de dados
Trabalhos de projecto de mestrado - 2009
Issue Date: 2009
Abstract: O Projecto de Engenharia Informática descrito neste relatório tem como objectivo a realização de um projecto de Data Quality na área de Seguros, para um Cliente da instituição de acolhimento. O projecto foi realizado em equipa constituída por: Aluna, um Consultor Sénior e um Gestor de Projecto. A ferramenta utilizada ao longo de todo o trabalho foi o Trillium Software System. O principal objectivo do Projecto de “Data Quality – Entidades” a realizar surge da necessidade de optimização da qualidade de dados de Entidades (informação do cliente), reduzindo custos operacionais e aumentando o conhecimento do valor de cliente (Entidade). Destaca-se ainda a necessidade de conseguir obter uma visão integrada do cliente, que se encontra distribuído pelas várias companhias de seguros (cinco), garantindo ao mesmo tempo, a qualidade e normalização dos dados, e a performance dos processos de qualidade. Desta forma, será possível obter uma visão única e uniformizada de um cliente como uma só Entidade. Considera-se que o Projecto se decompõe em 2 fases. Uma primeira de Data Profiling, considerando análise, validação e investigação dos dados. Como output desta etapa é apresentado o estado inicial dos dados, realçando os principais problemas e erros encontrados, servindo como ponto de partida para a fase seguinte. A segunda fase, Data Quality, considerando normalização e enriquecimento dos dados, para posterior desduplicação de Entidades. As tarefas para atingir o objectivo passam por limpeza, reestruturação, e aplicação de standards aos dados, para que se possível estes possam ser enriquecidos. Em forma de conclusão, a primeira fase do Projecto foi cumprida com sucesso, apresentando resultados surpreendentes para o Cliente. Até ao término do período de estágio, a segunda fase do projecto apenas foi possível realizar a normalização e enriquecimento. Ficando em falta a desduplicação efectiva de Entidades.
The “Projecto em Engenharia Informática” described in this document has the specific purpose of developing a Data Quality Solution on Insurance Activity Sector, for a Client of the host institution. The project was carried out with a team consisting of: the student, a Senior Consultant and a Project Manager. The tool used throughout the work was the Trillium Software System. The main objective of the project “Data Quality – Entities” aroused from the need to optimize the quality of entities data (customer information), reducing expenses and increasing customer (Entity) knowledge value. In addition, there was the need to obtain an integrated customer view, which is distributed by the several insurance companies (five), while insuring the quality and standardization of data and performance of quality processes. Thus, it’s possible to achieve a single and standardized view of a customer as a single entity. This project can be divided into 2 major phases. The first one, Data Profiling, considering analysis, validation and research data. As output of this phase is presented the initial state of the data, highlighting the main problems and errors found, serving as a starting point for the next phase. The second phase, Data Quality, considering standardization and enrichment of data, for subsequent Entities deduplication. The tasks to achieve the proposed objective are cleaning, restructuring, and implementation of data standards, so that if possible they can be enriched. In conclusion, the first phase of the project was met with success, with surprising results for the client. By the end of the probationary period, was only possible to realize the standardization and enrichment for the second phase of the project. Therefore, there were missing the actual deduplication of Entities.
Description: Trabalho de projecto de mestrado em Engenharia Informática (Sistemas de Informação), apresentado à Universidade de Lisboa, através da Faculdade de Ciências, 2009
URI: http://hdl.handle.net/10451/4586
Appears in Collections:FC - Dissertações de Mestrado

Files in This Item:

File Description SizeFormat
ulfc055964_tm_Ana_Teresa_Pedro.pdf1.08 MBAdobe PDFView/Open
Restrict Access. You can request a copy!
Statistics
FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

  © Universidade de Lisboa / SIBUL
Alameda da Universidade | Cidade Universitária | 1649-004 Lisboa | Portugal
Tel. +351 217967624 | Fax +351 217933624 | repositorio@reitoria.ul.pt - Feedback - Statistics
DeGóis
  Estamos no RCAAP Governo Português separator Ministério da Educação e Ciência   Fundação para a Ciência e a Tecnologia

Financiado por:

POS_C UE