Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/14049
Título: A new methodology for the analysis and validation of clusters and biclusters of genes
Autor: Lourenço, Artur Pedro Duarte Reis Bastos
Orientador: Silva, Mário J. Gaspar da, 1961-
Freitas, Ana Teresa
Palavras-chave: Biclusters
Validação biológica de agrupamentos de genes
Bioinfomática
Information retrieval
Teses de mestrado - 2006
Data de Defesa: 2006
Resumo: A era da pós-genómica e das tecnologias de larga escala traz consigo a necessidade de desenvolver novos métodos para lidar com grandes quantidades de dados. Para tal, têm sido aplicados algoritmos de clustering e biclustering em bioinformática para descobrir padrões em dados biológicos. A validação dos resultados de clustering e de biclustering é essencial para a sua análise. Esta dissertação propõe uma nova metodologia para validar resultados de clustering e biclustering. A metodologia transpõe conceitos do algoritmo PageRank para ordenação dos termos da Gene Ontology associados a um cluster. O significado biológico de cada conjunto de genes é determinado pelos termos no topo da ordenação. A metodologia de validação foi concretizada numa nova ferramenta, denominada TermRank, e foi avaliada através da caracterização de um conjunto de clusters artificiais. A metodologia foi também utilizada para validar o resultado de um algoritmo de biclustering aplicado a dados reais de um estudo sobre a resposta global de Saccharomyces cerevisiae a um stress químico. A avaliação da ferramenta TermRank mostrou que esta produz caracterizações correctas dos clusters gerados artificialmente e que o algoritmo de biclustering gera biclusters compostos por genes relacionados entre si.
The era of post-genomics and high-throughput technologies brings the need for developing new methods to cope with very large amounts of data. Clustering and biclustering algorithms have been used in bioinformatics to discover patterns in biological data. The validation of clustering and biclustering results is essential for their analysis. This dissertation presents a new methodology for validating and characterizing clustering and biclustering results, which uses PageRank concepts to rank Gene Ontology terms. The top ranked terms associated to each set of genes describe their biological interpretation. The validation methodology was implemented in a new tool, designated TermRank, and was evaluated through characterization of a set of artificial clusters. The methodology was also used to validate the output of a biclustering algorithm applied to real data from a study of the global response of Saccharomyces cerevisiae to a chemical stress. The evaluation showed that TermRank produces correct characterizations of the artificially generated clusters and that the biclusters generated by the validated biclustering algorithm are composed of related genes.
Descrição: Tese de mestrado em Bioinformática, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2006
URI: http://hdl.handle.net/10451/14049
http://repositorio.ul.pt/handle/10455/3326
Aparece nas colecções:FC-DI - Master Thesis (dissertation)

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
artur-lourenco-mestrado.pdf507 kBAdobe PDFVer/Abrir    Acesso Restrito. Solicitar cópia ao autor!


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.