Utilize este identificador para referenciar este registo: http://hdl.handle.net/10451/14211
Título: Collecting Statistics about the Portuguese Web
Autor: Gomes, Daniel
Silva, Mário J.
Palavras-chave: Web
characterization
Portuguese
Portugal
tumba!
statistics
crawling
Data: Jun-2003
Editora: Department of Informatics, University of Lisbon
Relatório da Série N.º: di-fcul-tr-03-10
Resumo: This report presents a characterization of text documents from the Portuguese Web. This characterization was produced from a crawl of over 4 million URLs and 131 thousand sites in 2003. We describe rules that we established for defvining its boundaries and the methodology used to gather statistics. We also show how crawling constraints and abnormal situations on the Web can influence the results
URI: http://hdl.handle.net/10451/14211
http://repositorio.ul.pt/handle/10455/2916
Aparece nas colecções:FC-DI - Technical Reports

Ficheiros deste registo:
Ficheiro Descrição TamanhoFormato 
03-10.pdf248,62 kBAdobe PDFVer/Abrir


FacebookTwitterDeliciousLinkedInDiggGoogle BookmarksMySpace
Formato BibTex MendeleyEndnote Degois 

Todos os registos no repositório estão protegidos por leis de copyright, com todos os direitos reservados.