Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/22409
Título: Mining cardiac side-effects of known drugs
Autor: Barros, Joana Carina Marques
Orientador: Falcão, André Osório e Cruz de Azerêdo, 1969-
Palavras-chave: Quimio-informática
Human ether-à-go-go-related gene
Aprendizagem automática
Relações estrutura-atividade quantitativas
Teses de mestrado - 2015
Data de Defesa: 2015
Resumo: O canal iónico hERG é crucial para a manutenção do funcionamento do batimento cardíaco no entanto a sua suscetibilidade a uma variedade de fármacos torna-o sensível a várias de terapias comuns. Os métodos mais típicos para a verificação de inibidores do hERG baseiam se em análises de eletrofisiologia patch-clamp, no entanto estas metodologias estão associadas a um elevado custo e duração. Novas abordagens para a avaliação da segurança de fármacos nas fases iniciais de desenvolvimento são cruciais. Atualmente, estudos in silico que permitem estabelecer relações entre moléculas e a sua resposta biológica (QSAR) são amplamente usados uma vez que permitem selecionar as propriedades moleculares cruciais para a função de um fármaco. Com esta tese propõem-se novos modelos de predição da inibição da proteína hERG construídos aplicando técnicas QSAR a um conjunto de moléculas recolhidas da literatura e da base de dados ChEMBL. De forma a complementar os modelos QSAR foi testada uma nova abordagem usando semelhança molecular calculada através da ferramenta NAMS. Vários métodos, como Florestas Aleatórias, Máquinas de Vetores de Suporte, Regressão Linear e Least Absolute Shrinkage and Selection Operator, para a redução de variáveis foram aplicados a diferentes coleções de descritores e fingerprints moleculares. O melhor método para a seleção de variáveis resultou da combinação de Regressão Linear com Máquinas de Vetores de Suporte que obteve um R2 de 0.61. O processo de seleção de variáveis é crucial para a obtenção de bons modelos QSAR e a utilização de várias coleções de descritores e fingerprints moleculares permitiu selecionar o conjunto melhor adaptado ao caso em questão. O melhor modelo de predição sem a aplicação de limiares de semelhança molecular obteve um R2 de ≈ 0:56. Os modelos QSAR complementados usando uma abordagem baseada em semelhança estrutural para a seleção de moléculas 80% e 90% semelhantes obtiveram valores de R2 de ≈ 0:63 e ≈ 0:37, respetivamente. Utilizando os mesmos limiares de semelhança foram adicionalmente obtidos dois novos modelos baseados na média ponderada entre o pIC50 e o valor da semelhança das moléculas selecionadas, estes modelos obtiveram R2 de ≈ 0:52 e ≈ 0:57, respetivamente. Com esta abordagem foi possível verificar a importância da semelhança molecular para a predição do comportamento de fármacos. Modelos que utilizaram informação estrutural direta, com o uso de fingerprints moleculares, ou indiretamente, através seleção de moléculas estruturalmente semelhantes, obtiveram melhores resultados o que suporta a premissa de que moléculas estruturalmente semelhantes exibem características físico-químicas idênticas. O conhecimento obtido com a elaboração desta dissertação permitiu a construção de uma ferramenta online, hERGIP, que permite a predição de inibidores do hERG e que se encontra disponível para toda a comunidade. Esta ferramenta foi comparada com o Pred-hERG, que aplica classificação binária para determinar inibidores do hERG, e foi possível verificar que ambas apresentam um comportamento semelhante o que faz do hERGIP uma ferramenta inovadora na medida em que permite obter a predição do pIC50 para a determinação de inibidores do hERG.
The hERG protein is crucial in maintaining the heart's normal function however, many drugs target it due to its promiscuity to a variety of structurally different molecules thus representing a therapeutic challenge. The most common approach is based on conventional patch-clamp electrophysiology which is expensive and time consuming. Viable approaches to evaluate a compounds safety are needed to be applied in the early stages of the drug development process. Studies that help establish relations between a molecule and the respective biological response (QSAR) are widely used in this type of situations. This thesis proposes new prediction methods to determine hERG inhibitors. To achieve this QSAR methodologies were applied to a collection of molecules retrieved from the literature and the ChEMBL database. A new approach using structural similarity performed with NAMS was also tested to complement the QSAR prediction models. Different variable reduction methods, such as Random Forests, Support Vector Machines an Linear Regression and Least Absolute Shrinkage Method were applied to different molecular descriptors collections and molecular fingerprints. The best variable selection method was a combination between a Linear Regression and Support Vector Machines which yield an R2 of 0.61. The variable reduction process is a vital step for the development of good QSAR models and the application of several molecular descriptors and fingerprint collections enabled the selection of the more appropriate variables to be used. The best prediction model without using a similarity threshold achieved an R2 of ≈ 0:56. The QSAR prediction models using a structural similarity approach to select molecules 80% and 90% similar yield R2 values of ≈ 0:63 and ≈ 0:37. Two other prediction models using the weighted mean between molecules pIC50 an similarity value using the same similarity thresholds returned R2 of ≈ 0:52 for the 80% threshold and ≈ 0:57 for the 90% threshold. This research was useful to gain insight regarding the use of molecular similarity for the prediction of a drug's bioactivity. Prediction models directly or indirectly using molecular similarity for QSAR model building yield the best results supporting the assertion "similar molecules have similar features". The knowledge gained with this research enabled the construction of hERGIP, a free webtool for the prediction of hERG inhibitors. A comparison of this tool with Pred-hERG, which utilizes binary classification, suggested that they performed equally, making hERGIP a novel tool since it applies regression to determine hERG inhibitors by measuring the molecule's pIC50.
Descrição: Tese de mestrado, Bioinformática e Biologia Computacional (Bioinformática), Universidade de Lisboa, Faculdade de Ciências, 2015
URI: http://hdl.handle.net/10451/22409
Designação: Tese de mestrado em Bioinformática e Biologia Computacional (Bioinformática)
Aparece nas colecções:FC-DI - Master Thesis (dissertation)

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
ulfc116068_tm_Joana_Barros.pdf3,29 MBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.