Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/31527
Título: Analysis of genomic changes during adaptive evolution in Drosophila Subobscura populations of contrasting biogeographical history
Autor: Antunes, Marta Maria Alves
Orientador: Matos, Margarida Maria Demony de Carneiro Pacheco de, 1958-
Seabra, Sofia Gonçalves, 1975-
Palavras-chave: Drosophila Subobscura
Evolução e resequenciação
Base de dados para localização de sequências
Inversões cromossómicas
"RAD-sequencing"
Teses de mestrado - 2017
Data de Defesa: 2017
Resumo: Um dos objectivos principais da biologia é entender como é que os organismos evoluem e se adaptam a novos ambientes. A prática de evolução experimental em laboratório é uma metodologia muito eficaz pois permite estudar a evolução a ocorrer em tempo real. Em alternativa a estudar a evolução na natureza, muitas vezes dificil de realizar, as populações são analisadas ao longo de gerações de evolução em ambiente controlado do laboratório. Desta forma, é muito mais fácil perceber quais as variáveis que podem estar envolvidas no processo evolutivo e evitar efeitos imprevisíveis exteriores à experiência. Também é possível manusear os indivíduos e controlar o seu acasalamento, garantindo desta forma a não ocorrência de troca de genes não pretendida entre populações. O aparecimento da possibilidade de sequenciar muitos indíviduos a baixos custos permitiu explorar esta temática da evolução de populações também ao nível genómico. Surgiram nomeadamente as técnicas de sequenciação genómicas de conjuntos (“pools”) de indíviduos (“Pool-sequencing”) e sequenciação de DNA associado a locais de restrição (“RAD-sequencing”). Estas duas técnicas foram usadas na obtenção de dados analisados neste trabalho. A abordagem usada chama-se “evolve and resequencing”, ou seja ”evoluir e resequenciar”, e significa que as populações são sequenciadas em vários momentos ao longo de diversas gerações, de forma a ser possível acompanhar alterações evolutivas que estejam a ocorrer no genoma dos indivíduos. Neste trabalho foram analisadas as alterações genómicas ocorridas em duas populações de Drosophila subobscura amostradas em dois locais europeus de latitudes contrastantes (Adraga, em Sintra, Portugal e Groningen na Holanda) durante a sua adaptação ao ambiente do laboratório. A escolha desta espécie deveu-se ao facto de apresentar elevado polimorfismo ao nível de inversões cromossómicas no seu genoma e já ter sido observada, para as duas populações referidas anteriormente, convergência a nível fenotípico quando colocadas em laboratório mas não a nível da frequência das inversões. Os arranjos cromossómicos (inversões) foram um destaque neste trabalho porque afectam a arquitectura genómica das populações ao reduzirem a recombinação nos locais onde se encontram. Foram indicados como também estando implicados na adaptação climática nesta espécie dado que a sua frequência varia de acordo com a latitude onde se encontram as populações que as possuem. Na primeira parte do trabalho, caracterizei os polimorfismos nucleotídicos simples (SNPs) obtidos no estudo de “Pool-sequencing” que deram indicações de seleção, analisando os que foram reconhecidos como estando associados (i.e. que deram “hits”) a proteínas nestas duas populações. Detectei que muitos genes estão sob seleção nestas populações o que sugere uma base poligénica de adaptação. Também observei que estão envolvidos em processos biológicos distintos entre populações, reforçando a constatação de que as populações apesar de convergirem fenotipicamente o fazem por caminhos genéticos distintos. A única família de genes que foi encontrada sob seleção nas duas populações foi a famíla de genes do receptor gustativo, envolvido no reconhecimento de alimentos. Também caracterizei o tipo de mutação que cada SNP provoca e foi interessante descobrir que alguns dos SNPs sob seleção se encontram em pequenas regiões intrónicas. A segunda parte do trabalho consistiu em analisar os dados obtidos por “RAD-sequencing”. As duas metodologias de sequenciação são complementares uma vez que a sequenciação genómica de “pools” de indivíduos permite obter mais marcadores de DNA mas sem informação individuals enquanto que usando enzimas de restrição se obtêm menos marcadores mas com informação individual para muitos indivíduos separadamente. Esta última abordagem, permitiu observar que os indivíduos sequenciados estão mais separados pelas inversões que possuem do que pela população a que pertencem, ou seja, um indíviduo de uma população pode ser mais semelhante a um de outra população se possuir a mesma inversão no seu genoma. Além disso, foram observadas as alterações genómicas em cromosomas com inversões específicas, tanto ao nível do total de SNPs detectados em cada cromosoma como também ao nível dos SNPs sob seleção. Como ilustração das potencialidades deste estudo, neste trabalho foram analisadas três arranjos cromossómicos, O3+4, OST e A2. Foram analisadas alterações entre gerações da mesma população mas também a diferenciação entre populações e como esta diferenciação entre populações evolui ao longo do tempo. As análises dos cromosomas com a inversão A2 foram aquelas que permitiram uma mais robusta análise dos resultados devido ao número de indivíduos amostrados. Foi detectada maior diferenciação entre gerações nos SNPs da população de Groningen do que nos de Adraga, o que está de acordo com o que foi encontrado na análise de dados de Pool-seq onde a maioria dos SNPs candidatos nesta população se encontram no cromosoma A. Isto poderá indicar que o cromosoma A tem um papel fundamental na adaptação desta população ao ambiente do laboratório. O total de SNPs neste cromossoma não deu indicações de convergência entre as duas populações, pelo contrário sugerem divergência, i.e. aumento da diferenciação entre as populações ao longo do tempo. Um aspecto fundamental foi analisar até que ponto as populações dão indicação de terem uma dinâmica adaptativa semelhante a nivel genómico, ou se, pelo contrário, elas não convergem em SNPs com sinal de selecção. De facto, em concordância com dados de pool-seq, na análise dos cromossomas com inversão A2 foram detectados poucos SNPs comuns entre as duas populações a darem sinal de selecção. Como era de esperar, a diferenciação dos SNPs candidatos (i.e. aqueles que deram sinal de selecção) entre gerações foi maior na população para a qual os SNPs foram detectados. No entanto, os mesmos SNPs também responderam na outra população com alterações temporais superiores à diferenciação global de todos os SNPs, o que sugere que os SNPs que estão sob seleção numa populacão também podem estar, pelo menos em parte, na outra. Comparando os resultados obtidos nas várias inversões/arranjos analisados, podemos dizer que não foi detectada convergência nem para o total de SNPs em cada cromosoma nem entre os SNPs sob seleção em cada cromosoma, o que indica que, em geral, estas populações usam diferentes vias a nível genómico para atingir o mesmo estado a nível fenotípico. Este trabalho vem adicionar novos elementos para a questão dos mecanismos que levam à manutenção das inversões. Permite perceber que esta é uma questão complexa e portanto é necessária a realização de mais análises, nomeadamente análises de diferenciação nos outros cromossomas, análises de desequilíbrio de ligação (“linkage disequilibrium”) e o mapeamento de mais zonas do genoma. Finalmente, ao nível de ferramentas bioinformáticas criadas, foram desenvolvidas duas que foram essenciais para a realização deste trabalho. Especificamente desenvolvi: uma base de dados que denominei DsubSeqLoc, que integra informação que estava dispersa na literatura, facilitando a localização cromossómica de sequências de genes de Drosophila subobscura já publicados, relevante quer em análises de dados de “Pool-seq” quer nos dados de “RAD-seq”; e uma “pipeline” que permite remover um dos haplótipos parentais do genótipo dos descendentes, necessário para a análise genómica das sequencias de RAD-seq. A base de dados DsubSeqLoc permite armazenar num único local toda a informação que se conhece atualmente acerca da localização de sequências de Drosophila subobscura. A integração desta informação é essencial pois ainda não existe um genoma de referência completamente anotado para a espécie e vai crescer em tamanho e importância à medida que novas sequências vão sendo mapeadas. Prevê-se que esta base de dados vá contribuir muito para futuros estudos nesta espécie. Além disso, também foi criada uma página web (http://www-personal.fc.ul.pt/~mmmatos/DsubSeqLoc) que permite um fácil acesso à informação mesmo a utilizadores que não estejam familiarizados com a escrita de queries SQL. Por sua vez a “pipeline” criada no contexto desta dissertação permite remover um dos haplótipos parentais dos genótipo dos seus descendentes. No contexto desta tese foi uma ferramenta muito util na análise de dados de RAD-seq, pois o DNA extraído pertencia a larvas que resultaram do cruzamento das nossas populações com a linha homocariotípica chcu (protocolo usado na identificação das inversões), e apenas queríamos, obviamente, analisar os haplótipos das nossas populações. Por exemplo, no contexto deste trabalho, o DNA extraído pertencia a larvas que resultaram do cruzamento de uma população wild com a linha homocaritípica chcu, mas apenas queriamos analisar os haplótipos das populações wild. A pipeline serviu deste modo para simplificar o processo de eliminação dos haplótipos que não tinham interesse para o nosso estudo. Se não tivesse sido criada muitos programas individuais teriam de ser executados para obter os haplótipos de interesse. Além disso, a pipeline permite fazer um passo de filtragem e mantém os registos da quantidade de dados que foi filtrada. Além de tudo isto, a pipeline não apresenta especificidade para os nossos dados, podendo ser utilizada na realização de outros estudos. Estará assim disponivel a outros utilizadores, e.g. sempre que seja requerido retirar o haplótipo de um dos progenitores. Este trabalho permitiu entender melhor o processo de adaptação ao nível genómico de populações de Drosophila subobscura. Este trabalho pioneiro abriu novos horizontes de investigação, deixando interessantes questões em aberto a abordar no futuro.
Experimental evolution is a powerful approach to study adaptation of populations in real-time. Using this approach, I studied at the genome-wide level the evolution of two populations of Drosophila subobscura derived from two contrasting biogeographical latitudes (Adraga, Portugal and Groningen, Netherlands), across generations since laboratory introduction. Modern sequencing technologies are now providing a high resolution in the analysis of patterns of genetic variation. In the context of this dissertation, I analyzed ‘evolve-and-resequence’ data (that is, genomic information across generations) of both populations obtained by Pool-sequencing and RAD-sequencing at two generations (6 and 25) after founding these populations in the common, laboratorial environment. With the pool-seq data I characterized SNPs that indicated selection and gave hits with proteins. I discovered that many genes and different biological processes are at play, suggesting a polygenic basis of adaptation. Only one family of genes was found in common between the two populations, associated with recognition of taste stimuli. I also classified each SNP in the type of mutation and interestingly found several genes under selection in small intronic regions. Chromosomal inversions may play an important role in genomic evolution and population differentiation, because they affect the genomic architecture of populations by suppressing or reducing recombination in these inverted regions. In the context of this thesis I analysed the RAD-sequencing data of many individuals with known karyotypes of both populations across generations. Interestingly, individuals were more clearly separated by the inversion they carry than by the population to which they belong. I compared the differentiation between generations and between populations both for all SNPs in each chromosome and for candidate SNPs (that gave signs of being under selection). Also, I analysed how the genetic differentiation between populations changed through time. I detected that candidate SNPs differed between populations, in accordance with what was already observed at the Pool-seq level. Nevertheless, the SNPs under selection in one population also suggested some selective response in the other, although to a smaller extent. It was not detected convergence between the two populations neither for total SNPs of each chromosome neither for candidate SNPs. Focusing on the chromosomes with A2 inversion there was a higher differentiation between populations than chromosomes with other inversions, considering the same period of time. Furthermore, I developed two bioinformatic tools that were essential to make the analyses: a database called DsubSeqLoc (http://www-personal.fc.ul.pt/~mmmatos/DsubSeqLoc) that integrates information already published of the cytological location of genes or of other genomic regions in Drosophila subobscura and a pipeline that removes one parental haplotype from the progeny.
Descrição: Tese de mestrado, Bioinformática e Biologia Computacional (Bioinformática) Universidade de Lisboa, Faculdade de Ciências, 2017
URI: http://hdl.handle.net/10451/31527
Designação: Mestrado em Bioinformática e Biologia Computacional (Bioinformática)
Aparece nas colecções:FC - Dissertações de Mestrado

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
ulfc123963_tm_Marta_Antunes.pdf3,54 MBAdobe PDFVer/Abrir    Acesso Restrito. Solicitar cópia ao autor!


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.