Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
Autor(a) principal: | |
---|---|
Data de Publicação: | 2010 |
Outros Autores: | , , , , |
Tipo de documento: | Artigo |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRGS |
Texto Completo: | http://hdl.handle.net/10183/265050 |
Resumo: | A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresenta os resultados iniciais do trabalho, aponta algum dos problemas envolvidos e identifica técnicas que podem ser úteis para continuidade do trabalho. O objetivo final do trabalho é criar uma ferramenta que possibilite avaliar a qualidade de sites com conteúdo relacionado à área de saúde. Assim, os resultados do processo de extração são utilizados para popular uma ontologia onde estão definidos os critérios de qualidade para as páginas Web. |
id |
UFRGS-2_d84c15382809f0ca9ebc1b66bd7cad01 |
---|---|
oai_identifier_str |
oai:www.lume.ufrgs.br:10183/265050 |
network_acronym_str |
UFRGS-2 |
network_name_str |
Repositório Institucional da UFRGS |
repository_id_str |
|
spelling |
Lichtnow, DanielOliveira, Jose Palazzo Moreira deLima, Jose Valdeni deProenca Junior, Mario LemesBarros, Rodolfo Miranda deAdaniya, Mario Henrique A. C.2023-09-22T03:32:07Z20101519-132Xhttp://hdl.handle.net/10183/265050000766134A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresenta os resultados iniciais do trabalho, aponta algum dos problemas envolvidos e identifica técnicas que podem ser úteis para continuidade do trabalho. O objetivo final do trabalho é criar uma ferramenta que possibilite avaliar a qualidade de sites com conteúdo relacionado à área de saúde. Assim, os resultados do processo de extração são utilizados para popular uma ontologia onde estão definidos os critérios de qualidade para as páginas Web.The content quality of Web pages can be determined partially by indicators such as authorship, presence of references and publisher reputation. This paper discusses the application of information extraction techniques on the identification of quality indicators, specifically authorship. Unlike other extraction techniques, the techniques of our work, try to make the extraction without consider the structure of Web pages. The final goal of our work is to create tools to assess the quality of web pages that have topics related to health. In this sense, the goal is to use the results of extraction to populate an ontology where are defined quality criteria for web pages.application/pdfporCadernos de informática. Vol. 5, n. 1 (2010), p. 77-88Web semânticaRecuperacao : InformacaoTécnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologiasinfo:eu-repo/semantics/articleinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000766134.pdf.txt000766134.pdf.txtExtracted Texttext/plain29655http://www.lume.ufrgs.br/bitstream/10183/265050/2/000766134.pdf.txtab7401e84ebb10207bad0f7e1ba89046MD52ORIGINAL000766134.pdfTexto completoapplication/pdf111315http://www.lume.ufrgs.br/bitstream/10183/265050/1/000766134.pdfdb0ed142303ac3af16053b1953221d8eMD5110183/2650502023-09-23 03:37:55.039355oai:www.lume.ufrgs.br:10183/265050Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-09-23T06:37:55Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false |
dc.title.pt_BR.fl_str_mv |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias |
title |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias |
spellingShingle |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias Lichtnow, Daniel Web semântica Recuperacao : Informacao |
title_short |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias |
title_full |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias |
title_fullStr |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias |
title_full_unstemmed |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias |
title_sort |
Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias |
author |
Lichtnow, Daniel |
author_facet |
Lichtnow, Daniel Oliveira, Jose Palazzo Moreira de Lima, Jose Valdeni de Proenca Junior, Mario Lemes Barros, Rodolfo Miranda de Adaniya, Mario Henrique A. C. |
author_role |
author |
author2 |
Oliveira, Jose Palazzo Moreira de Lima, Jose Valdeni de Proenca Junior, Mario Lemes Barros, Rodolfo Miranda de Adaniya, Mario Henrique A. C. |
author2_role |
author author author author author |
dc.contributor.author.fl_str_mv |
Lichtnow, Daniel Oliveira, Jose Palazzo Moreira de Lima, Jose Valdeni de Proenca Junior, Mario Lemes Barros, Rodolfo Miranda de Adaniya, Mario Henrique A. C. |
dc.subject.por.fl_str_mv |
Web semântica Recuperacao : Informacao |
topic |
Web semântica Recuperacao : Informacao |
description |
A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresenta os resultados iniciais do trabalho, aponta algum dos problemas envolvidos e identifica técnicas que podem ser úteis para continuidade do trabalho. O objetivo final do trabalho é criar uma ferramenta que possibilite avaliar a qualidade de sites com conteúdo relacionado à área de saúde. Assim, os resultados do processo de extração são utilizados para popular uma ontologia onde estão definidos os critérios de qualidade para as páginas Web. |
publishDate |
2010 |
dc.date.issued.fl_str_mv |
2010 |
dc.date.accessioned.fl_str_mv |
2023-09-22T03:32:07Z |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/other |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10183/265050 |
dc.identifier.issn.pt_BR.fl_str_mv |
1519-132X |
dc.identifier.nrb.pt_BR.fl_str_mv |
000766134 |
identifier_str_mv |
1519-132X 000766134 |
url |
http://hdl.handle.net/10183/265050 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.ispartof.pt_BR.fl_str_mv |
Cadernos de informática. Vol. 5, n. 1 (2010), p. 77-88 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRGS instname:Universidade Federal do Rio Grande do Sul (UFRGS) instacron:UFRGS |
instname_str |
Universidade Federal do Rio Grande do Sul (UFRGS) |
instacron_str |
UFRGS |
institution |
UFRGS |
reponame_str |
Repositório Institucional da UFRGS |
collection |
Repositório Institucional da UFRGS |
bitstream.url.fl_str_mv |
http://www.lume.ufrgs.br/bitstream/10183/265050/2/000766134.pdf.txt http://www.lume.ufrgs.br/bitstream/10183/265050/1/000766134.pdf |
bitstream.checksum.fl_str_mv |
ab7401e84ebb10207bad0f7e1ba89046 db0ed142303ac3af16053b1953221d8e |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS) |
repository.mail.fl_str_mv |
|
_version_ |
1815447839398952960 |