Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/12157
Título: NGSOnto: proposta de uma ontologia para descrever o processo de sequenciação de alto desempenho
Autor: Silva, Mickael Santos da
Orientador: Carriço, João André Nogueira Custódio
Couto, Francisco José Moreira
Palavras-chave: Ontologias
Sequenciação do genoma completo
Serviço Web RESTFul
Métodos de tipagem microbiana
Teses de mestrado - 2014
Data de Defesa: 2014
Resumo: Com o aparecimento dos novos métodos de sequenciação de alto desempenho, tem-se verificado uma diminuição de custos na sequenciação em larga escala de genomas através da tecnologia denominada de “Next Generation Sequencing” (NGS), resultado numa cada vez maior produção de informação genómica. Um dos campos onde a aplicação destas novas tecnologias de sequenciação, têm provas dadas de sucesso é em Epidemiologia Molecular, cujo objectivo é detectar e seguir surtos bacterianos. Casos recentes e mediáticos de surtos de estirpes bacterianas perigosas para a saúde pública, como o surto de cólera em 2010 no Haiti e E.coli O104:H4 na Alemanha em 2011, têm revelado as competências das tecnologias NGS relativamente às tecnicas de tipagem até então utilizadas. No entanto para os dados serem comparáveis e reprodutíveis, todo o processo desde a extração do DNA até há analise final de resultados necessitam de ser documentados. Até ao momento, os principais serviços de pesquisa e inserção de dados de NGS, como o Sequence Read Archive (SRA) e European Nucleotide Archive (ENA), apresentam algumas limitações, nomeadamente no que se refere à anotação dos processos laboratoriais e em processos de analise in silico dos dados. Neste trabalho foi desenvolvida uma ontologia relacionado com a sequenciação de nova geração, a NGSOnto. Esta ontologia foi construida de forma a descrever o fluxo de trabalho de um processo de sequenciação por NGS, sendo que esta ontologia reutiliza conceitos da Ontology for Biomedical Investigation (OBI) entre outras. Para construir a ontologia foi utilizada a Web Ontology Language (OWL), utilizando a estrutura da Basic Formal Ontology (BFO) 1.1 e guardando a informação através da Resource Description Framework (RDF). Foi também criada, como prova de conceito de aplicação da ontologia, uma interface programática REST de modo a possibilitar a inserção e consulta de dados num formato que sejam possíveis de ser lidos por máquinas , e uma interface web de fácil utilização para clientes com menos conhecimentos programáticos, que utiliza a REST API desenvolvida. Com a anotação dos dados usando a NGSOnto, a captura do fluxo de trabalho de todos os processos envolvidos permite assegurar a reprodutibilidade de todo o processo através da utilização um vocabulário controlado e especifico para o campo, com benefícios óbvios para investigação em diversas áreas que usam NGS e para validação e certificação de resultados em aplicações clinicas.
With the appearance of new high throughput sequencing tecnologies, there has been a significant decrease in large scale sequencing costs through technologies known as "Next Generation Sequencing"(NGS), resulting in an increasing genomic information production. One of the successful application fields of this new sequencing technologies has been the Molecular Epidemology, where the main aim is at detecting and following bacterian outbreaks. Recent and known cases of such outbreaks where NGS technologies have proven their capacity, comparing with previous typing methods, are the cholera outbreak in 2010 at Haiti and the E.coli O104:H4 at Germany in 2011. However, to be able to compare and reproduce this data, it's necessary to keep the information of all processes, starting at the DNA Extraction process until the last final results analysis. At this moment, the main NGS data search and insertion services, such as o Sequence Read Archive (SRA) and European Nucleotide Archive (ENA), present some limitations, namely at the annotation of performed laboratorial processes and consequent in silico data analysis processes. Considering the previous facts, an ontology about the new sequencing generation was developed, the NGSOnto. This ontology was developed in order to describe the full workflow of a NGS sequencing process, reusing concepts of the Ontology for Biomedical Investigation (OBI) and others. The Web Ontology Language (OWL) was used to develop the NGSOnto, using the Basic Formal Ontology (BFO) 1.1 high level structure and saving the data trough the Resource Description Framework (RDF). In order to perform a concept proof of case of the NGSOnto, a REST Application Programming Interface (API) was developed, providing a mean to insert and access the data in a machine readable format, and a web interface, that uses the REST API developed, for users with less programatic skills. Using NGSOnto, the capture of all the workflow process information provides a mean to ensure the reproducibility of the NGS process, through a controled and domain specific vocabulary, providing obvious benefits for scientific investigation areas using NGS technologies and certification of clinical results.
Descrição: Tese de mestrado em Bioinformática e Biologia Computacional (Bioinformática), apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2014
URI: http://hdl.handle.net/10451/12157
Designação: Mestrado em Bioinformática e Biologia Computacional
Aparece nas colecções:FC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
ulfc109997_tm_Mickael_Silva.pdf682,43 kBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.