Um sistema de recuperação de informação da língua Tétum

Detalhes bibliográficos
Autor(a) principal: Antonino, Borja Loedaci Cauthe Patrocinio
Data de Publicação: 2013
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10174/16170
Resumo: As tecnologias de informação atuais e os serviços baseados na web necessitam de gerir, selecionar e filtrar quantidades crescentes de informação textual. A classificação dos textos permite aos utilizadores consultar mais facilmente o conjunto dos textos do seu interesse. Este paradigma é muito eficaz tanto na filtragem de informação como no desenvolvimento dos serviços online dirigidos para o utilizador. Propõe-se nesta dissertação um sistema de recuperação de informação para Língua Tetum baseada na plataforma open-source \Apache Solr". Este sistema foi desenvolvido com o objetivo de facilitar mais os utilizadores timorenses de fazer pesquisa com sua própria língua, o tetum. Foi testado versus os principais sistemas de recuperações de informações atuais como Google e Bing para ver a sua adaptação com a língua tetum. Os resultados dos testes mostram que este sistema desenvolvido ultrapassou os dois grandes sistemas de recuperações de informações atuais em nível da resposta da pesquisa, e no futuro pode tornar-se como sistema de recuperação de informação recomendado para os utilizadores timorenses de fazer pesquisa com sua própria língua; ABSTRACT:Current information technology and Web-based services need to manage, select and lter out increasing amounts of textual information. The text classi cation allows users to browse more easily the set of texts of interest. This paradigm is very e cient for ltering information in the development of online services directed to the user. Proposed in this dissertation an information retrieval system for language Tetum based on open-source platform "Apache Solr". This system was developed to facilitate Timorese users to do research with their own language, Tetum language. Was tested versus the current major information retrieval system like Google and Bing to see the adaptation of current system with Tetum. The test results show that this system developed exceeded two current major information retrieval systems at the level of survey response, and in the future can make this system as the recommended information retrieval system for Timorese users to do their own research language.
id RCAP_55e9a43a17154e8e3e776daa5303dd3f
oai_identifier_str oai:dspace.uevora.pt:10174/16170
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Um sistema de recuperação de informação da língua TétumRecuperação de informaçãoSistema de recuperação de informaçãoApache SolrLíngua TétumInformation retrievalInformation retrieval systemApache SolrTétumAs tecnologias de informação atuais e os serviços baseados na web necessitam de gerir, selecionar e filtrar quantidades crescentes de informação textual. A classificação dos textos permite aos utilizadores consultar mais facilmente o conjunto dos textos do seu interesse. Este paradigma é muito eficaz tanto na filtragem de informação como no desenvolvimento dos serviços online dirigidos para o utilizador. Propõe-se nesta dissertação um sistema de recuperação de informação para Língua Tetum baseada na plataforma open-source \Apache Solr". Este sistema foi desenvolvido com o objetivo de facilitar mais os utilizadores timorenses de fazer pesquisa com sua própria língua, o tetum. Foi testado versus os principais sistemas de recuperações de informações atuais como Google e Bing para ver a sua adaptação com a língua tetum. Os resultados dos testes mostram que este sistema desenvolvido ultrapassou os dois grandes sistemas de recuperações de informações atuais em nível da resposta da pesquisa, e no futuro pode tornar-se como sistema de recuperação de informação recomendado para os utilizadores timorenses de fazer pesquisa com sua própria língua; ABSTRACT:Current information technology and Web-based services need to manage, select and lter out increasing amounts of textual information. The text classi cation allows users to browse more easily the set of texts of interest. This paradigm is very e cient for ltering information in the development of online services directed to the user. Proposed in this dissertation an information retrieval system for language Tetum based on open-source platform "Apache Solr". This system was developed to facilitate Timorese users to do research with their own language, Tetum language. Was tested versus the current major information retrieval system like Google and Bing to see the adaptation of current system with Tetum. The test results show that this system developed exceeded two current major information retrieval systems at the level of survey response, and in the future can make this system as the recommended information retrieval system for Timorese users to do their own research language.Universidade de Évora2015-11-02T14:14:57Z2015-11-022013-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/10174/16170http://hdl.handle.net/10174/16170porDepartamento de Informáticateses@bib.uevora.pt283Antonino, Borja Loedaci Cauthe Patrocinioinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-01-03T19:02:40Zoai:dspace.uevora.pt:10174/16170Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T01:08:36.767833Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Um sistema de recuperação de informação da língua Tétum
title Um sistema de recuperação de informação da língua Tétum
spellingShingle Um sistema de recuperação de informação da língua Tétum
Antonino, Borja Loedaci Cauthe Patrocinio
Recuperação de informação
Sistema de recuperação de informação
Apache Solr
Língua Tétum
Information retrieval
Information retrieval system
Apache Solr
Tétum
title_short Um sistema de recuperação de informação da língua Tétum
title_full Um sistema de recuperação de informação da língua Tétum
title_fullStr Um sistema de recuperação de informação da língua Tétum
title_full_unstemmed Um sistema de recuperação de informação da língua Tétum
title_sort Um sistema de recuperação de informação da língua Tétum
author Antonino, Borja Loedaci Cauthe Patrocinio
author_facet Antonino, Borja Loedaci Cauthe Patrocinio
author_role author
dc.contributor.author.fl_str_mv Antonino, Borja Loedaci Cauthe Patrocinio
dc.subject.por.fl_str_mv Recuperação de informação
Sistema de recuperação de informação
Apache Solr
Língua Tétum
Information retrieval
Information retrieval system
Apache Solr
Tétum
topic Recuperação de informação
Sistema de recuperação de informação
Apache Solr
Língua Tétum
Information retrieval
Information retrieval system
Apache Solr
Tétum
description As tecnologias de informação atuais e os serviços baseados na web necessitam de gerir, selecionar e filtrar quantidades crescentes de informação textual. A classificação dos textos permite aos utilizadores consultar mais facilmente o conjunto dos textos do seu interesse. Este paradigma é muito eficaz tanto na filtragem de informação como no desenvolvimento dos serviços online dirigidos para o utilizador. Propõe-se nesta dissertação um sistema de recuperação de informação para Língua Tetum baseada na plataforma open-source \Apache Solr". Este sistema foi desenvolvido com o objetivo de facilitar mais os utilizadores timorenses de fazer pesquisa com sua própria língua, o tetum. Foi testado versus os principais sistemas de recuperações de informações atuais como Google e Bing para ver a sua adaptação com a língua tetum. Os resultados dos testes mostram que este sistema desenvolvido ultrapassou os dois grandes sistemas de recuperações de informações atuais em nível da resposta da pesquisa, e no futuro pode tornar-se como sistema de recuperação de informação recomendado para os utilizadores timorenses de fazer pesquisa com sua própria língua; ABSTRACT:Current information technology and Web-based services need to manage, select and lter out increasing amounts of textual information. The text classi cation allows users to browse more easily the set of texts of interest. This paradigm is very e cient for ltering information in the development of online services directed to the user. Proposed in this dissertation an information retrieval system for language Tetum based on open-source platform "Apache Solr". This system was developed to facilitate Timorese users to do research with their own language, Tetum language. Was tested versus the current major information retrieval system like Google and Bing to see the adaptation of current system with Tetum. The test results show that this system developed exceeded two current major information retrieval systems at the level of survey response, and in the future can make this system as the recommended information retrieval system for Timorese users to do their own research language.
publishDate 2013
dc.date.none.fl_str_mv 2013-01-01T00:00:00Z
2015-11-02T14:14:57Z
2015-11-02
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10174/16170
http://hdl.handle.net/10174/16170
url http://hdl.handle.net/10174/16170
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv Departamento de Informática
teses@bib.uevora.pt
283
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de Évora
publisher.none.fl_str_mv Universidade de Évora
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799136568764530688