Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/13996
Título: Deep linguistic processing of portuguese noun phrases
Autor: Costa, Francisco Nuno Quintiliano Mendonça Carapeto
Orientador: Branco, António H., 1963-
Palavras-chave: Natural language processing
Unification grammars
Typed feature logics
Deep linguistic processing
Teses de mestrado - 2007
Data de Defesa: 2007
Relatório da Série N.º: di-fcul-tr-07-34
Resumo: This dissertation describes the implementation of a fragment of Portuguese in a computational grammar LXGram currently being developed in the University of Lisbon. LXGram is a computational grammar for the deep linguistic processing of Portuguese. As such, it can be used to parse Portuguese sentences, producing a formal description of their meaning, or to generate Portuguese sentences from meaning representations. LXGram is developed in a platform that is specifically designed to handle such grammars the Linguistic Knowledge Builder (LKB).The LKB implements very efficient algorithms for parsing and generation. It accepts a formalism that is declarative and resorts to unification as the fundamental operation. It also employs a strict type system with multiple inheritance, which provides an elegant means of stating interesting generalizations and allows for static type checking. Several other grammars have been developed in the LKB, for other natural languages. Some of these grammars have been integrated in useful applications, like machine translation, automated e-mail responses, grammar checking and information extraction. This dissertation describes the modeling and computational implementation of a set of linguistic phenomena in LXGram. These phenomena are related to the grammatical properties and the meaning of the Portuguese noun phrase (any Portuguese expression that can appear in the contexts where personal pronouns are allowed). The implementation of these phenomena in LXGram focuses on some aspects that are not very developed in the other LKB grammars. A computational model that accounts for several interesting interactions among them is new. In the first two chapters of this dissertation we provide an introduction to the task at hand, and we describe the tools and formalism that are adopted. The three chapters that follow present the data to be covered and the solutions that were adopted. The last chapter reviews the main points of the dissertation, includes an evaluation of the resulting implementation and suggests future work.
Esta dissertação descreve a implementação de um fragmento do Português numa gramática computacional LXGram actualmente em desenvolvimento na Universidade de Lisboa. A LXGram é uma gramática computacional para o processamento linguístico profundo do Português. Como tal, pode ser utilizada para analisar frases do Português, produzindo uma descrição formal do seu significado, ou para gerar frases em Português a partir de representações do significado. A LXGram é desenvolvida numa plataforma desenhada especificamente para acomodar tais gramáticas o Linguistic Knowledge Builder (LKB). O LKB implementa algoritmos muito e cientes de análise e geração. Aceita um formalismo que é declarativo e a operação fundamental é a uni cação. Adicionalmente emprega um sistema de tipos rígido com herança múltipla, o que proporciona um meio elegante de formular generalizações interessantes e permite verificação estática de tipos. Existem várias outras gramáticas desenvolvidas no LKB, para outras línguas naturais. Algumas destas gramáticas têm vindo a ser integradas em aplicações úteis, como a tradução automática, sistemas de respostas automáticas a correio electrónico, correctores gramaticais e extracção de informação. Esta dissertação descreve a modelação e a implementação computacional na LXGram de um conjunto de fenómenos linguísticos. Estes fenómenos relacionam-se com as propriedades gramaticais e o significado dos sintagmas nominais em Português (qualquer expressão do Português que pode ocorrer nos contextos onde os pronomes pessoais também ocorrem). A implementação destes fenómenos na LXGram foca-se em alguns aspectos que não estão muito desenvolvidos nas outras gramáticas implementadas no LKB. É novo um modelo computacional que dá conta de diversas interacções interessantes entre eles.Nos primeiros dois capítulos desta dissertação faz-se uma introdução à tarefa em questão e descrevem-se as ferramentas e o formalismo adoptados. Os três capítulos seguintes apresentam os dados que são cobertos e as soluções que foram adoptadas. O último capítulo inclui uma revisão das ideias principais da dissertação, uma avaliação da implementação levada a cabo e sugestões de trabalho futuro.
Descrição: Tese de mestrado em Informática, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2007
URI: http://hdl.handle.net/10451/13996
http://repositorio.ul.pt/handle/10455/3061
Aparece nas colecções:FC-DI - Master Thesis (dissertation)

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
07-34.pdf4,56 MBAdobe PDFVer/Abrir    Acesso Restrito. Solicitar cópia ao autor!


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.