Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias

Detalhes bibliográficos
Autor(a) principal: Lichtnow, Daniel
Data de Publicação: 2010
Outros Autores: Oliveira, Jose Palazzo Moreira de, Lima, Jose Valdeni de, Proenca Junior, Mario Lemes, Barros, Rodolfo Miranda de, Adaniya, Mario Henrique A. C.
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da UFRGS
Texto Completo: http://hdl.handle.net/10183/265050
Resumo: A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresenta os resultados iniciais do trabalho, aponta algum dos problemas envolvidos e identifica técnicas que podem ser úteis para continuidade do trabalho. O objetivo final do trabalho é criar uma ferramenta que possibilite avaliar a qualidade de sites com conteúdo relacionado à área de saúde. Assim, os resultados do processo de extração são utilizados para popular uma ontologia onde estão definidos os critérios de qualidade para as páginas Web.
id UFRGS-2_d84c15382809f0ca9ebc1b66bd7cad01
oai_identifier_str oai:www.lume.ufrgs.br:10183/265050
network_acronym_str UFRGS-2
network_name_str Repositório Institucional da UFRGS
repository_id_str
spelling Lichtnow, DanielOliveira, Jose Palazzo Moreira deLima, Jose Valdeni deProenca Junior, Mario LemesBarros, Rodolfo Miranda deAdaniya, Mario Henrique A. C.2023-09-22T03:32:07Z20101519-132Xhttp://hdl.handle.net/10183/265050000766134A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresenta os resultados iniciais do trabalho, aponta algum dos problemas envolvidos e identifica técnicas que podem ser úteis para continuidade do trabalho. O objetivo final do trabalho é criar uma ferramenta que possibilite avaliar a qualidade de sites com conteúdo relacionado à área de saúde. Assim, os resultados do processo de extração são utilizados para popular uma ontologia onde estão definidos os critérios de qualidade para as páginas Web.The content quality of Web pages can be determined partially by indicators such as authorship, presence of references and publisher reputation. This paper discusses the application of information extraction techniques on the identification of quality indicators, specifically authorship. Unlike other extraction techniques, the techniques of our work, try to make the extraction without consider the structure of Web pages. The final goal of our work is to create tools to assess the quality of web pages that have topics related to health. In this sense, the goal is to use the results of extraction to populate an ontology where are defined quality criteria for web pages.application/pdfporCadernos de informática. Vol. 5, n. 1 (2010), p. 77-88Web semânticaRecuperacao : InformacaoTécnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologiasinfo:eu-repo/semantics/articleinfo:eu-repo/semantics/otherinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRGSinstname:Universidade Federal do Rio Grande do Sul (UFRGS)instacron:UFRGSTEXT000766134.pdf.txt000766134.pdf.txtExtracted Texttext/plain29655http://www.lume.ufrgs.br/bitstream/10183/265050/2/000766134.pdf.txtab7401e84ebb10207bad0f7e1ba89046MD52ORIGINAL000766134.pdfTexto completoapplication/pdf111315http://www.lume.ufrgs.br/bitstream/10183/265050/1/000766134.pdfdb0ed142303ac3af16053b1953221d8eMD5110183/2650502023-09-23 03:37:55.039355oai:www.lume.ufrgs.br:10183/265050Repositório de PublicaçõesPUBhttps://lume.ufrgs.br/oai/requestopendoar:2023-09-23T06:37:55Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)false
dc.title.pt_BR.fl_str_mv Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
title Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
spellingShingle Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
Lichtnow, Daniel
Web semântica
Recuperacao : Informacao
title_short Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
title_full Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
title_fullStr Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
title_full_unstemmed Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
title_sort Técnicas de extração de informação para avaliação da qualidade de páginas web com o uso de ontologias
author Lichtnow, Daniel
author_facet Lichtnow, Daniel
Oliveira, Jose Palazzo Moreira de
Lima, Jose Valdeni de
Proenca Junior, Mario Lemes
Barros, Rodolfo Miranda de
Adaniya, Mario Henrique A. C.
author_role author
author2 Oliveira, Jose Palazzo Moreira de
Lima, Jose Valdeni de
Proenca Junior, Mario Lemes
Barros, Rodolfo Miranda de
Adaniya, Mario Henrique A. C.
author2_role author
author
author
author
author
dc.contributor.author.fl_str_mv Lichtnow, Daniel
Oliveira, Jose Palazzo Moreira de
Lima, Jose Valdeni de
Proenca Junior, Mario Lemes
Barros, Rodolfo Miranda de
Adaniya, Mario Henrique A. C.
dc.subject.por.fl_str_mv Web semântica
Recuperacao : Informacao
topic Web semântica
Recuperacao : Informacao
description A qualidade dos conteúdos das páginas Web pode ser determinada parcialmente através de indicadores como autoria da página, existência de referências as fontes e reputação do responsável pela publicação. Este artigo discute a aplicação de técnicas de extração de informação na identificação de indicadores de qualidade, especificamente autoria. Ao contrário de outras técnicas de extração, as técnicas desenvolvidas neste trabalho não utilizam a estrutura das páginas. Neste sentido, o artigo apresenta os resultados iniciais do trabalho, aponta algum dos problemas envolvidos e identifica técnicas que podem ser úteis para continuidade do trabalho. O objetivo final do trabalho é criar uma ferramenta que possibilite avaliar a qualidade de sites com conteúdo relacionado à área de saúde. Assim, os resultados do processo de extração são utilizados para popular uma ontologia onde estão definidos os critérios de qualidade para as páginas Web.
publishDate 2010
dc.date.issued.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2023-09-22T03:32:07Z
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/other
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10183/265050
dc.identifier.issn.pt_BR.fl_str_mv 1519-132X
dc.identifier.nrb.pt_BR.fl_str_mv 000766134
identifier_str_mv 1519-132X
000766134
url http://hdl.handle.net/10183/265050
dc.language.iso.fl_str_mv por
language por
dc.relation.ispartof.pt_BR.fl_str_mv Cadernos de informática. Vol. 5, n. 1 (2010), p. 77-88
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRGS
instname:Universidade Federal do Rio Grande do Sul (UFRGS)
instacron:UFRGS
instname_str Universidade Federal do Rio Grande do Sul (UFRGS)
instacron_str UFRGS
institution UFRGS
reponame_str Repositório Institucional da UFRGS
collection Repositório Institucional da UFRGS
bitstream.url.fl_str_mv http://www.lume.ufrgs.br/bitstream/10183/265050/2/000766134.pdf.txt
http://www.lume.ufrgs.br/bitstream/10183/265050/1/000766134.pdf
bitstream.checksum.fl_str_mv ab7401e84ebb10207bad0f7e1ba89046
db0ed142303ac3af16053b1953221d8e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRGS - Universidade Federal do Rio Grande do Sul (UFRGS)
repository.mail.fl_str_mv
_version_ 1801225099368464384