Universidade de Lisboa Repositório da Universidade de Lisboa

Repositório da Universidade de Lisboa >
Faculdade de Letras (FL) >
FL - Dissertações de Mestrado >

Please use this identifier to cite or link to this item: http://hdl.handle.net/10451/4125

Título: Para uma tradução automática baseada em conhecimento: especificação da modificação e da predicação adjectiva
Autor: Ibrahimo, Náheda
Orientador: Marrafa, Palmira,1948-
Palavras-chave: Língua portuguesa
Língua inglesa
Tradução automática
Análise linguística
Teses de mestrado - 2010
Issue Date: 2010
Resumo: Desde o seu surgimento nos anos 40, a investigação em Tradução Automática (TA) tem-se norteado essencialmente por um objectivo: criar sistemas de tradução totalmente automatizados de alto desempenho e qualidade. Embora a tensão entre adequação linguística e eficiência computacional seja dificilmente ultrapassável, a distância entre as duas vai sendo minorada através da identificação de problemas específicos e da definição de especificações que concorram para a melhoria da qualidade dos outputs. O presente trabalho examina o desempenho de três ferramentas de tradução automática disponíveis na Internet e avalia a qualidade dos seus outputs na tradução de expressões adjectivais no par de línguas Português-Inglês, propondo simultaneamente especificações linguísticas que contribuam para um melhor desempenho dos sistemas. A metodologia adoptada é de carácter eminentemente empírico, tendo-se baseado na observação do comportamento dos sistemas Google, Systran e SDL Free Translation na tradução de expressões adjectivais (predicados secundários e predicados complexos), na identificação e descrição dos problemas detectados e no estabelecimento das especificações linguísticas necessárias a integrar num sistema baseado em conhecimento. Os resultados obtidos demonstram que o desempenho não satisfatório dos sistemas relativamente às estruturas linguísticas estudadas se deve a dois factores: por um lado, à ambiguidade e complexidade lexical e estrutural dos inputs e, por outro lado, à inexistência de especificações linguísticas nos sistemas de TA para lidar com estas estruturas. Com base nestes resultados, conclui-se que a melhoria da qualidade dos outputs dos sistemas de TA passa necessariamente pelo controlo da linguagem para redução da ambiguidade e da complexidade linguística e pelo estabelecimento de especificações linguísticas a serem codificadas nos sistemas.
Abstract: Ever since the emergence of Machine Translation (MT) in the 1940s, research in this field has been guided by one main goal: to create fully automatic, high-quality and high-performance MT systems. Although the tension between linguistic adequacy and computational efficiency remains difficult to overcome, the gap between the two has been gradually narrowed by identifying specific problems and defining linguistic specifications that can contribute towards enhancing the quality of the output from MT systems. This work examines the performance of three translation systems available online and assesses their output quality in the translation of adjectival expressions in the language pair of Portuguese-English, while at the same time proposing linguistic specifications that may contribute towards improvements in the performance of these systems. The methodology adopted was largely an empirical one and consisted of observing the behaviour of the Google, Systran and SDL Free Translation MT systems in the translation of adjectival expressions (secondary predicates and complex predicates), identifying and describing the problems detected and establishing the necessary linguistic specifications to be integrated into a knowledge-based MT system. The results show that the non-satisfactory performance of MT systems as far as these adjectival expressions are concerned derives from two main factors: on the one hand, from the lexical and structural ambiguity and complexity of the inputs; and, on the other hand, from the lack of linguistic specifications in MT systems to deal with these structures. Based on these findings, we can conclude that the improvement of the output quality of MT systems must follow two major paths: control of the language in order to reduce linguistic ambiguity and complexity; and the establishment of linguistic specifications that can be codified in the systems.
Descrição: Tese de mestrado, Tradução, Universidade de Lisboa, Faculdade de Letras, 2010
URI: http://hdl.handle.net/10451/4125
Appears in Collections:FL - Dissertações de Mestrado

Files in This Item:

File Description SizeFormat
ulfl081176_tm.pdf1,28 MBAdobe PDFView/Open
Statistics
FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpaceOrkut
Formato BibTex mendeley Endnote Logotipo do DeGóis 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

  © Universidade de Lisboa / SIBUL
Alameda da Universidade | Cidade Universitária | 1649-004 Lisboa | Portugal
Tel. +351 217967624 | Fax +351 217933624 | repositorio@reitoria.ul.pt - Feedback - Statistics
DeGóis
Promotores do RCAAP   Financiadores do RCAAP

Fundação para a Ciência e a Tecnologia Universidade do Minho   Governo Português Ministério da Educação e Ciência PO Sociedade do Conhecimento (POSC) Portal oficial da União Europeia