Extração e mineração de informação independente de domínios da web na língua portuguesa

Detalhes bibliográficos
Autor(a) principal: Pires, Julio Cesar Batista
Data de Publicação: 2015
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFG
dARK ID: ark:/38995/00130000012mx
Texto Completo: http://repositorio.bc.ufg.br/tede/handle/tede/4723
Resumo: Many people are constantly connected on the Web. They are looking for all kinds of things. The Web is a huge source of information. So, they can find almost everything they want. However, Web information is disorganized and have no formal structure. This hampers machine processing and consequently makes information access more difficult. Bringing structure to the Web can be one of the key points for facilitating user searching and navigation. A recent technique, Open Information Extraction, has been successfully applied to extract structured information from the Web. This technique has been mostly applied in pages written in English. This work is specifically focused on information extraction for Portuguese. Techniques used here can be also used to other languages too.
id UFG-2_beaaaa61c7c9cde22de1d85fc1d910e1
oai_identifier_str oai:repositorio.bc.ufg.br:tede/4723
network_acronym_str UFG-2
network_name_str Repositório Institucional da UFG
repository_id_str
spelling Carvalho, Cedric Luiz dehttp://lattes.cnpq.br/4090131106212286Carvalho, Cedric Luiz deAmbrósio, Ana Paula LaboissièreVieira, Renatahttp://lattes.cnpq.br/7687935305280678Pires, Julio Cesar Batista2015-10-22T13:08:50Z2015-05-08PIRES, J. C. B. Extração e mineração de informação independente de domínios da web na língua portuguesa. 2015. 91 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2015.http://repositorio.bc.ufg.br/tede/handle/tede/4723ark:/38995/00130000012mxMany people are constantly connected on the Web. They are looking for all kinds of things. The Web is a huge source of information. So, they can find almost everything they want. However, Web information is disorganized and have no formal structure. This hampers machine processing and consequently makes information access more difficult. Bringing structure to the Web can be one of the key points for facilitating user searching and navigation. A recent technique, Open Information Extraction, has been successfully applied to extract structured information from the Web. This technique has been mostly applied in pages written in English. This work is specifically focused on information extraction for Portuguese. Techniques used here can be also used to other languages too.Muitas pessoas estão constantemente conectadas na Web. Elas estão procurando por todo tipo de coisa. A Web é uma enorme fonte de informação. Assim, as pessoas podem encontrar praticamente tudo que elas precisam. Entretanto, as informações da Web são desorganizadas e não possuem uma estrutura formal. Isso dificulta o processamento das máquinas e consequentemente torna o acesso à informaçã mais difícil. Trazer estrutura para a Web pode ser um dos pontos chave para facilitar a busca e navegaçã dos usuários. Uma técnica recente, Extração de Informação Aberta, foi aplicada com sucesso para extrair informação da Web. Essa técnica foi aplicada principalmente em páginas em Inglês. Este trabalho é focado especificamente na extração de informação em Português. As técnicas usadas aqui também podem ser utilizadas para outras linguagens.Submitted by Cássia Santos (cassia.bcufg@gmail.com) on 2015-10-21T14:08:06Z No. of bitstreams: 2 Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-10-22T13:08:50Z (GMT) No. of bitstreams: 2 Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)Made available in DSpace on 2015-10-22T13:08:50Z (GMT). No. of bitstreams: 2 Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2015-05-08Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttp://repositorio.bc.ufg.br/tede/retrieve/21441/Disserta%c3%a7%c3%a3o%20-%20Julio%20Cesar%20Batista%20Pires%20-%202015.pdf.jpgporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessWeb SemanticaExtracao de informacaoMineracao de dadosSemantic webInformation extractionData miningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOExtração e mineração de informação independente de domínios da web na língua portuguesaExtraction and mining domain independent information from web in portugueseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-3303550325223384799600600600600-771226673463364476836717112058112045092075167498588264571reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://repositorio.bc.ufg.br/tede/bitstreams/37f6e941-03de-4652-9d7f-79b6b398e0d4/downloadbd3efa91386c1718a7f26a329fdcb468MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://repositorio.bc.ufg.br/tede/bitstreams/c9637d01-6a8e-443c-af01-d1d94c2bcd51/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-821328http://repositorio.bc.ufg.br/tede/bitstreams/ece702a7-9a56-40f7-9b77-77706f5c1431/download683d9883b2ad62ac3b8bafc566b2e600MD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823148http://repositorio.bc.ufg.br/tede/bitstreams/e76f7b89-a821-4e05-a0a4-a7d463c84be4/download9da0b6dfac957114c6a7714714b86306MD54ORIGINALDissertação - Julio Cesar Batista Pires - 2015.pdfDissertação - Julio Cesar Batista Pires - 2015.pdfapplication/pdf2026124http://repositorio.bc.ufg.br/tede/bitstreams/e519afaf-10fb-4572-a7c2-9848132d11be/downloaddda6bea6dfa125f21d2023f288178ebcMD55TEXTDissertação - Julio Cesar Batista Pires - 2015.pdf.txtDissertação - Julio Cesar Batista Pires - 2015.pdf.txtExtracted Texttext/plain179286http://repositorio.bc.ufg.br/tede/bitstreams/edfed9ba-df6b-4c64-894d-8185456ba9da/download5798e741c07ea8527cc46a414b39bc2aMD56THUMBNAILDissertação - Julio Cesar Batista Pires - 2015.pdf.jpgDissertação - Julio Cesar Batista Pires - 2015.pdf.jpgGenerated Thumbnailimage/jpeg3518http://repositorio.bc.ufg.br/tede/bitstreams/03b0e2a3-04eb-4948-9e29-15ac24ed1d33/download06ac071239608010df70b2d68e03827cMD57tede/47232015-10-23 03:03:37.986http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/4723http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2015-10-23T05:03:37Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=
dc.title.por.fl_str_mv Extração e mineração de informação independente de domínios da web na língua portuguesa
dc.title.alternative.eng.fl_str_mv Extraction and mining domain independent information from web in portuguese
title Extração e mineração de informação independente de domínios da web na língua portuguesa
spellingShingle Extração e mineração de informação independente de domínios da web na língua portuguesa
Pires, Julio Cesar Batista
Web Semantica
Extracao de informacao
Mineracao de dados
Semantic web
Information extraction
Data mining
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Extração e mineração de informação independente de domínios da web na língua portuguesa
title_full Extração e mineração de informação independente de domínios da web na língua portuguesa
title_fullStr Extração e mineração de informação independente de domínios da web na língua portuguesa
title_full_unstemmed Extração e mineração de informação independente de domínios da web na língua portuguesa
title_sort Extração e mineração de informação independente de domínios da web na língua portuguesa
author Pires, Julio Cesar Batista
author_facet Pires, Julio Cesar Batista
author_role author
dc.contributor.advisor1.fl_str_mv Carvalho, Cedric Luiz de
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/4090131106212286
dc.contributor.referee1.fl_str_mv Carvalho, Cedric Luiz de
dc.contributor.referee2.fl_str_mv Ambrósio, Ana Paula Laboissière
dc.contributor.referee3.fl_str_mv Vieira, Renata
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/7687935305280678
dc.contributor.author.fl_str_mv Pires, Julio Cesar Batista
contributor_str_mv Carvalho, Cedric Luiz de
Carvalho, Cedric Luiz de
Ambrósio, Ana Paula Laboissière
Vieira, Renata
dc.subject.por.fl_str_mv Web Semantica
Extracao de informacao
Mineracao de dados
topic Web Semantica
Extracao de informacao
Mineracao de dados
Semantic web
Information extraction
Data mining
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
dc.subject.eng.fl_str_mv Semantic web
Information extraction
Data mining
dc.subject.cnpq.fl_str_mv CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description Many people are constantly connected on the Web. They are looking for all kinds of things. The Web is a huge source of information. So, they can find almost everything they want. However, Web information is disorganized and have no formal structure. This hampers machine processing and consequently makes information access more difficult. Bringing structure to the Web can be one of the key points for facilitating user searching and navigation. A recent technique, Open Information Extraction, has been successfully applied to extract structured information from the Web. This technique has been mostly applied in pages written in English. This work is specifically focused on information extraction for Portuguese. Techniques used here can be also used to other languages too.
publishDate 2015
dc.date.accessioned.fl_str_mv 2015-10-22T13:08:50Z
dc.date.issued.fl_str_mv 2015-05-08
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv PIRES, J. C. B. Extração e mineração de informação independente de domínios da web na língua portuguesa. 2015. 91 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2015.
dc.identifier.uri.fl_str_mv http://repositorio.bc.ufg.br/tede/handle/tede/4723
dc.identifier.dark.fl_str_mv ark:/38995/00130000012mx
identifier_str_mv PIRES, J. C. B. Extração e mineração de informação independente de domínios da web na língua portuguesa. 2015. 91 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2015.
ark:/38995/00130000012mx
url http://repositorio.bc.ufg.br/tede/handle/tede/4723
dc.language.iso.fl_str_mv por
language por
dc.relation.program.fl_str_mv -3303550325223384799
dc.relation.confidence.fl_str_mv 600
600
600
600
dc.relation.department.fl_str_mv -7712266734633644768
dc.relation.cnpq.fl_str_mv 3671711205811204509
dc.relation.sponsorship.fl_str_mv 2075167498588264571
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by-nc-nd/4.0/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Goiás
dc.publisher.program.fl_str_mv Programa de Pós-graduação em Ciência da Computação (INF)
dc.publisher.initials.fl_str_mv UFG
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto de Informática - INF (RG)
publisher.none.fl_str_mv Universidade Federal de Goiás
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFG
instname:Universidade Federal de Goiás (UFG)
instacron:UFG
instname_str Universidade Federal de Goiás (UFG)
instacron_str UFG
institution UFG
reponame_str Repositório Institucional da UFG
collection Repositório Institucional da UFG
bitstream.url.fl_str_mv http://repositorio.bc.ufg.br/tede/bitstreams/37f6e941-03de-4652-9d7f-79b6b398e0d4/download
http://repositorio.bc.ufg.br/tede/bitstreams/c9637d01-6a8e-443c-af01-d1d94c2bcd51/download
http://repositorio.bc.ufg.br/tede/bitstreams/ece702a7-9a56-40f7-9b77-77706f5c1431/download
http://repositorio.bc.ufg.br/tede/bitstreams/e76f7b89-a821-4e05-a0a4-a7d463c84be4/download
http://repositorio.bc.ufg.br/tede/bitstreams/e519afaf-10fb-4572-a7c2-9848132d11be/download
http://repositorio.bc.ufg.br/tede/bitstreams/edfed9ba-df6b-4c64-894d-8185456ba9da/download
http://repositorio.bc.ufg.br/tede/bitstreams/03b0e2a3-04eb-4948-9e29-15ac24ed1d33/download
bitstream.checksum.fl_str_mv bd3efa91386c1718a7f26a329fdcb468
4afdbb8c545fd630ea7db775da747b2f
683d9883b2ad62ac3b8bafc566b2e600
9da0b6dfac957114c6a7714714b86306
dda6bea6dfa125f21d2023f288178ebc
5798e741c07ea8527cc46a414b39bc2a
06ac071239608010df70b2d68e03827c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)
repository.mail.fl_str_mv tasesdissertacoes.bc@ufg.br
_version_ 1815172520307851264