Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/14209
Título: A Statistical Study of the WPT-03 Corpus
Autor: Martins, Bruno
Silva, Mário J.
Palavras-chave: 
Data: Mai-2004
Editora: Department of Informatics, University of Lisbon
Relatório da Série N.º: di-fcul-tr-04-4
Resumo: This report presents a statistical study of WPT-03, a text corpus built from the pages of the `Portuguese Web' collected in the repository of the tumba! search engine. We give a statistical analysis of the textual contents available in the Portuguese Web, including size distributions, the language of the pages, and the terms they contain
URI: http://hdl.handle.net/10451/14209
http://repositorio.ul.pt/handle/10455/2914
Aparece nas colecções:FC-DI - Technical Reports

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
04-4.pdf109,57 kBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.