Um método para povoamento de ontologias: extração de textos da web no idioma português

Detalhes bibliográficos
Autor(a) principal: Lima, Fabio dos Santos
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFBA
Texto Completo: http://repositorio.ufba.br/ri/handle/ri/19378
Resumo: A produção e disponibilização de informações não estruturadas na Web aumentam diariamente. Essa abundância de informações desestruturadas representa um grande desafio para a aquisição de conhecimento que seja processado por seres humanos e também por máquinas. Nesse sentido, ao longo dos anos diversas abordagens têm sido propostas para a extração automática de informações a partir de textos escritos em linguagem natural. Contudo, ainda existem poucos estudos que investigam a extração de informações a partir de textos escritos em português. Diante disso, o objetivo deste trabalho é propor e avaliar uma abordagem não supervisionada para o povoamento de ontologias utilizando a Web como grande fonte de informações, no contexto da língua portuguesa. Além disso, apresenta: (i) uma breve discussão sobre medidas de pontuação baseadas na PMI (Pontuação de Informação Mútua); (ii) novas medidas de pontuação com base na PMI e no cálculo de Desvio Padrão; e (iii) uma avaliação das medidas discutidas no contexto de textos em português do Brasil extraídos da web. Os resultados obtidos com os experimentos realizados foram encorajadores e demonstraram que a abordagem proposta obteve uma taxa de precisão média de 70% na extração de instâncias de classes ontológicas.
id UFBA-2_633b2383c05b6e58dc774410db29fb90
oai_identifier_str oai:repositorio.ufba.br:ri/19378
network_acronym_str UFBA-2
network_name_str Repositório Institucional da UFBA
repository_id_str 1932
spelling Lima, Fabio dos SantosSalvador, Laís do NascimentoDurão, Frederico AraujoBulcão Neto, Renato de Freitas2016-06-03T23:23:38Z2016-06-03T23:23:38Z2016-06-032015-11-05http://repositorio.ufba.br/ri/handle/ri/19378A produção e disponibilização de informações não estruturadas na Web aumentam diariamente. Essa abundância de informações desestruturadas representa um grande desafio para a aquisição de conhecimento que seja processado por seres humanos e também por máquinas. Nesse sentido, ao longo dos anos diversas abordagens têm sido propostas para a extração automática de informações a partir de textos escritos em linguagem natural. Contudo, ainda existem poucos estudos que investigam a extração de informações a partir de textos escritos em português. Diante disso, o objetivo deste trabalho é propor e avaliar uma abordagem não supervisionada para o povoamento de ontologias utilizando a Web como grande fonte de informações, no contexto da língua portuguesa. Além disso, apresenta: (i) uma breve discussão sobre medidas de pontuação baseadas na PMI (Pontuação de Informação Mútua); (ii) novas medidas de pontuação com base na PMI e no cálculo de Desvio Padrão; e (iii) uma avaliação das medidas discutidas no contexto de textos em português do Brasil extraídos da web. Os resultados obtidos com os experimentos realizados foram encorajadores e demonstraram que a abordagem proposta obteve uma taxa de precisão média de 70% na extração de instâncias de classes ontológicas.Submitted by Marcio Filho (marcio.kleber@ufba.br) on 2016-05-31T16:37:27Z No. of bitstreams: 1 Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5)Approved for entry into archive by Alda Lima da Silva (sivalda@ufba.br) on 2016-06-03T23:23:38Z (GMT) No. of bitstreams: 1 Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5)Made available in DSpace on 2016-06-03T23:23:38Z (GMT). No. of bitstreams: 1 Dissertação Fabio Dos Santos Lima-corrigida-final.pdf: 2297835 bytes, checksum: 2aade3f62d20fd717c9065135a1c1493 (MD5)Ciência da ComputaçãoOntologiasPovoamento de OntologiasExtração de InformaçõesUm método para povoamento de ontologias: extração de textos da web no idioma portuguêsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisInstituto de Matemática. Departamento de Ciência da ComputaçãoMestrado Multiinstitucional em Ciência da ComputaçãoUFBABrasilinfo:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UFBAinstname:Universidade Federal da Bahia (UFBA)instacron:UFBAORIGINALDissertação Fabio Dos Santos Lima-corrigida-final.pdfDissertação Fabio Dos Santos Lima-corrigida-final.pdfapplication/pdf2297835https://repositorio.ufba.br/bitstream/ri/19378/1/Disserta%c3%a7%c3%a3o%20Fabio%20Dos%20Santos%20Lima-corrigida-final.pdf2aade3f62d20fd717c9065135a1c1493MD51LICENSElicense.txtlicense.txttext/plain1345https://repositorio.ufba.br/bitstream/ri/19378/2/license.txt0d4b811ef71182510d2015daa7c8a900MD52TEXTDissertação Fabio Dos Santos Lima-corrigida-final.pdf.txtDissertação Fabio Dos Santos Lima-corrigida-final.pdf.txtExtracted texttext/plain171812https://repositorio.ufba.br/bitstream/ri/19378/3/Disserta%c3%a7%c3%a3o%20Fabio%20Dos%20Santos%20Lima-corrigida-final.pdf.txt366449f066745cd4c22593841072847eMD53ri/193782022-02-20 21:42:07.535oai:repositorio.ufba.br:ri/19378VGVybW8gZGUgTGljZW4/YSwgbj9vIGV4Y2x1c2l2bywgcGFyYSBvIGRlcD9zaXRvIG5vIFJlcG9zaXQ/cmlvIEluc3RpdHVjaW9uYWwgZGEgVUZCQS4KCiBQZWxvIHByb2Nlc3NvIGRlIHN1Ym1pc3M/byBkZSBkb2N1bWVudG9zLCBvIGF1dG9yIG91IHNldSByZXByZXNlbnRhbnRlIGxlZ2FsLCBhbyBhY2VpdGFyIAplc3NlIHRlcm1vIGRlIGxpY2VuP2EsIGNvbmNlZGUgYW8gUmVwb3NpdD9yaW8gSW5zdGl0dWNpb25hbCBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkYSBCYWhpYSAKbyBkaXJlaXRvIGRlIG1hbnRlciB1bWEgYz9waWEgZW0gc2V1IHJlcG9zaXQ/cmlvIGNvbSBhIGZpbmFsaWRhZGUsIHByaW1laXJhLCBkZSBwcmVzZXJ2YT8/by4gCkVzc2VzIHRlcm1vcywgbj9vIGV4Y2x1c2l2b3MsIG1hbnQ/bSBvcyBkaXJlaXRvcyBkZSBhdXRvci9jb3B5cmlnaHQsIG1hcyBlbnRlbmRlIG8gZG9jdW1lbnRvIApjb21vIHBhcnRlIGRvIGFjZXJ2byBpbnRlbGVjdHVhbCBkZXNzYSBVbml2ZXJzaWRhZGUuCgogUGFyYSBvcyBkb2N1bWVudG9zIHB1YmxpY2Fkb3MgY29tIHJlcGFzc2UgZGUgZGlyZWl0b3MgZGUgZGlzdHJpYnVpPz9vLCBlc3NlIHRlcm1vIGRlIGxpY2VuP2EgCmVudGVuZGUgcXVlOgoKIE1hbnRlbmRvIG9zIGRpcmVpdG9zIGF1dG9yYWlzLCByZXBhc3NhZG9zIGEgdGVyY2Vpcm9zLCBlbSBjYXNvIGRlIHB1YmxpY2E/P2VzLCBvIHJlcG9zaXQ/cmlvCnBvZGUgcmVzdHJpbmdpciBvIGFjZXNzbyBhbyB0ZXh0byBpbnRlZ3JhbCwgbWFzIGxpYmVyYSBhcyBpbmZvcm1hPz9lcyBzb2JyZSBvIGRvY3VtZW50bwooTWV0YWRhZG9zIGVzY3JpdGl2b3MpLgoKIERlc3RhIGZvcm1hLCBhdGVuZGVuZG8gYW9zIGFuc2Vpb3MgZGVzc2EgdW5pdmVyc2lkYWRlIGVtIG1hbnRlciBzdWEgcHJvZHU/P28gY2llbnQ/ZmljYSBjb20gCmFzIHJlc3RyaT8/ZXMgaW1wb3N0YXMgcGVsb3MgZWRpdG9yZXMgZGUgcGVyaT9kaWNvcy4KCiBQYXJhIGFzIHB1YmxpY2E/P2VzIHNlbSBpbmljaWF0aXZhcyBxdWUgc2VndWVtIGEgcG9sP3RpY2EgZGUgQWNlc3NvIEFiZXJ0bywgb3MgZGVwP3NpdG9zIApjb21wdWxzP3Jpb3MgbmVzc2UgcmVwb3NpdD9yaW8gbWFudD9tIG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBtYXMgbWFudD9tIGFjZXNzbyBpcnJlc3RyaXRvIAphbyBtZXRhZGFkb3MgZSB0ZXh0byBjb21wbGV0by4gQXNzaW0sIGEgYWNlaXRhPz9vIGRlc3NlIHRlcm1vIG4/byBuZWNlc3NpdGEgZGUgY29uc2VudGltZW50bwogcG9yIHBhcnRlIGRlIGF1dG9yZXMvZGV0ZW50b3JlcyBkb3MgZGlyZWl0b3MsIHBvciBlc3RhcmVtIGVtIGluaWNpYXRpdmFzIGRlIGFjZXNzbyBhYmVydG8uCg==Repositório InstitucionalPUBhttp://192.188.11.11:8080/oai/requestopendoar:19322022-02-21T00:42:07Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)false
dc.title.pt_BR.fl_str_mv Um método para povoamento de ontologias: extração de textos da web no idioma português
title Um método para povoamento de ontologias: extração de textos da web no idioma português
spellingShingle Um método para povoamento de ontologias: extração de textos da web no idioma português
Lima, Fabio dos Santos
Ciência da Computação
Ontologias
Povoamento de Ontologias
Extração de Informações
title_short Um método para povoamento de ontologias: extração de textos da web no idioma português
title_full Um método para povoamento de ontologias: extração de textos da web no idioma português
title_fullStr Um método para povoamento de ontologias: extração de textos da web no idioma português
title_full_unstemmed Um método para povoamento de ontologias: extração de textos da web no idioma português
title_sort Um método para povoamento de ontologias: extração de textos da web no idioma português
author Lima, Fabio dos Santos
author_facet Lima, Fabio dos Santos
author_role author
dc.contributor.author.fl_str_mv Lima, Fabio dos Santos
dc.contributor.advisor1.fl_str_mv Salvador, Laís do Nascimento
dc.contributor.referee1.fl_str_mv Durão, Frederico Araujo
Bulcão Neto, Renato de Freitas
contributor_str_mv Salvador, Laís do Nascimento
Durão, Frederico Araujo
Bulcão Neto, Renato de Freitas
dc.subject.cnpq.fl_str_mv Ciência da Computação
topic Ciência da Computação
Ontologias
Povoamento de Ontologias
Extração de Informações
dc.subject.por.fl_str_mv Ontologias
Povoamento de Ontologias
Extração de Informações
description A produção e disponibilização de informações não estruturadas na Web aumentam diariamente. Essa abundância de informações desestruturadas representa um grande desafio para a aquisição de conhecimento que seja processado por seres humanos e também por máquinas. Nesse sentido, ao longo dos anos diversas abordagens têm sido propostas para a extração automática de informações a partir de textos escritos em linguagem natural. Contudo, ainda existem poucos estudos que investigam a extração de informações a partir de textos escritos em português. Diante disso, o objetivo deste trabalho é propor e avaliar uma abordagem não supervisionada para o povoamento de ontologias utilizando a Web como grande fonte de informações, no contexto da língua portuguesa. Além disso, apresenta: (i) uma breve discussão sobre medidas de pontuação baseadas na PMI (Pontuação de Informação Mútua); (ii) novas medidas de pontuação com base na PMI e no cálculo de Desvio Padrão; e (iii) uma avaliação das medidas discutidas no contexto de textos em português do Brasil extraídos da web. Os resultados obtidos com os experimentos realizados foram encorajadores e demonstraram que a abordagem proposta obteve uma taxa de precisão média de 70% na extração de instâncias de classes ontológicas.
publishDate 2015
dc.date.submitted.none.fl_str_mv 2015-11-05
dc.date.accessioned.fl_str_mv 2016-06-03T23:23:38Z
dc.date.available.fl_str_mv 2016-06-03T23:23:38Z
dc.date.issued.fl_str_mv 2016-06-03
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://repositorio.ufba.br/ri/handle/ri/19378
url http://repositorio.ufba.br/ri/handle/ri/19378
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Instituto de Matemática. Departamento de Ciência da Computação
dc.publisher.program.fl_str_mv Mestrado Multiinstitucional em Ciência da Computação
dc.publisher.initials.fl_str_mv UFBA
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Instituto de Matemática. Departamento de Ciência da Computação
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFBA
instname:Universidade Federal da Bahia (UFBA)
instacron:UFBA
instname_str Universidade Federal da Bahia (UFBA)
instacron_str UFBA
institution UFBA
reponame_str Repositório Institucional da UFBA
collection Repositório Institucional da UFBA
bitstream.url.fl_str_mv https://repositorio.ufba.br/bitstream/ri/19378/1/Disserta%c3%a7%c3%a3o%20Fabio%20Dos%20Santos%20Lima-corrigida-final.pdf
https://repositorio.ufba.br/bitstream/ri/19378/2/license.txt
https://repositorio.ufba.br/bitstream/ri/19378/3/Disserta%c3%a7%c3%a3o%20Fabio%20Dos%20Santos%20Lima-corrigida-final.pdf.txt
bitstream.checksum.fl_str_mv 2aade3f62d20fd717c9065135a1c1493
0d4b811ef71182510d2015daa7c8a900
366449f066745cd4c22593841072847e
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFBA - Universidade Federal da Bahia (UFBA)
repository.mail.fl_str_mv
_version_ 1808459514666549248