Extração e mineração de informação independente de domínios da web na língua portuguesa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2015 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFG |
dARK ID: | ark:/38995/00130000012mx |
Texto Completo: | http://repositorio.bc.ufg.br/tede/handle/tede/4723 |
Resumo: | Many people are constantly connected on the Web. They are looking for all kinds of things. The Web is a huge source of information. So, they can find almost everything they want. However, Web information is disorganized and have no formal structure. This hampers machine processing and consequently makes information access more difficult. Bringing structure to the Web can be one of the key points for facilitating user searching and navigation. A recent technique, Open Information Extraction, has been successfully applied to extract structured information from the Web. This technique has been mostly applied in pages written in English. This work is specifically focused on information extraction for Portuguese. Techniques used here can be also used to other languages too. |
id |
UFG-2_beaaaa61c7c9cde22de1d85fc1d910e1 |
---|---|
oai_identifier_str |
oai:repositorio.bc.ufg.br:tede/4723 |
network_acronym_str |
UFG-2 |
network_name_str |
Repositório Institucional da UFG |
repository_id_str |
|
spelling |
Carvalho, Cedric Luiz dehttp://lattes.cnpq.br/4090131106212286Carvalho, Cedric Luiz deAmbrósio, Ana Paula LaboissièreVieira, Renatahttp://lattes.cnpq.br/7687935305280678Pires, Julio Cesar Batista2015-10-22T13:08:50Z2015-05-08PIRES, J. C. B. Extração e mineração de informação independente de domínios da web na língua portuguesa. 2015. 91 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2015.http://repositorio.bc.ufg.br/tede/handle/tede/4723ark:/38995/00130000012mxMany people are constantly connected on the Web. They are looking for all kinds of things. The Web is a huge source of information. So, they can find almost everything they want. However, Web information is disorganized and have no formal structure. This hampers machine processing and consequently makes information access more difficult. Bringing structure to the Web can be one of the key points for facilitating user searching and navigation. A recent technique, Open Information Extraction, has been successfully applied to extract structured information from the Web. This technique has been mostly applied in pages written in English. This work is specifically focused on information extraction for Portuguese. Techniques used here can be also used to other languages too.Muitas pessoas estão constantemente conectadas na Web. Elas estão procurando por todo tipo de coisa. A Web é uma enorme fonte de informação. Assim, as pessoas podem encontrar praticamente tudo que elas precisam. Entretanto, as informações da Web são desorganizadas e não possuem uma estrutura formal. Isso dificulta o processamento das máquinas e consequentemente torna o acesso à informaçã mais difícil. Trazer estrutura para a Web pode ser um dos pontos chave para facilitar a busca e navegaçã dos usuários. Uma técnica recente, Extração de Informação Aberta, foi aplicada com sucesso para extrair informação da Web. Essa técnica foi aplicada principalmente em páginas em Inglês. Este trabalho é focado especificamente na extração de informação em Português. As técnicas usadas aqui também podem ser utilizadas para outras linguagens.Submitted by Cássia Santos (cassia.bcufg@gmail.com) on 2015-10-21T14:08:06Z No. of bitstreams: 2 Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)Approved for entry into archive by Luciana Ferreira (lucgeral@gmail.com) on 2015-10-22T13:08:50Z (GMT) No. of bitstreams: 2 Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5)Made available in DSpace on 2015-10-22T13:08:50Z (GMT). No. of bitstreams: 2 Dissertação - Julio Cesar Batista Pires - 2015.pdf: 2026124 bytes, checksum: dda6bea6dfa125f21d2023f288178ebc (MD5) license_rdf: 23148 bytes, checksum: 9da0b6dfac957114c6a7714714b86306 (MD5) Previous issue date: 2015-05-08Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESapplication/pdfhttp://repositorio.bc.ufg.br/tede/retrieve/21441/Disserta%c3%a7%c3%a3o%20-%20Julio%20Cesar%20Batista%20Pires%20-%202015.pdf.jpgporUniversidade Federal de GoiásPrograma de Pós-graduação em Ciência da Computação (INF)UFGBrasilInstituto de Informática - INF (RG)http://creativecommons.org/licenses/by-nc-nd/4.0/info:eu-repo/semantics/openAccessWeb SemanticaExtracao de informacaoMineracao de dadosSemantic webInformation extractionData miningCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOExtração e mineração de informação independente de domínios da web na língua portuguesaExtraction and mining domain independent information from web in portugueseinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesis-3303550325223384799600600600600-771226673463364476836717112058112045092075167498588264571reponame:Repositório Institucional da UFGinstname:Universidade Federal de Goiás (UFG)instacron:UFGLICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://repositorio.bc.ufg.br/tede/bitstreams/37f6e941-03de-4652-9d7f-79b6b398e0d4/downloadbd3efa91386c1718a7f26a329fdcb468MD51CC-LICENSElicense_urllicense_urltext/plain; charset=utf-849http://repositorio.bc.ufg.br/tede/bitstreams/c9637d01-6a8e-443c-af01-d1d94c2bcd51/download4afdbb8c545fd630ea7db775da747b2fMD52license_textlicense_texttext/html; charset=utf-821328http://repositorio.bc.ufg.br/tede/bitstreams/ece702a7-9a56-40f7-9b77-77706f5c1431/download683d9883b2ad62ac3b8bafc566b2e600MD53license_rdflicense_rdfapplication/rdf+xml; charset=utf-823148http://repositorio.bc.ufg.br/tede/bitstreams/e76f7b89-a821-4e05-a0a4-a7d463c84be4/download9da0b6dfac957114c6a7714714b86306MD54ORIGINALDissertação - Julio Cesar Batista Pires - 2015.pdfDissertação - Julio Cesar Batista Pires - 2015.pdfapplication/pdf2026124http://repositorio.bc.ufg.br/tede/bitstreams/e519afaf-10fb-4572-a7c2-9848132d11be/downloaddda6bea6dfa125f21d2023f288178ebcMD55TEXTDissertação - Julio Cesar Batista Pires - 2015.pdf.txtDissertação - Julio Cesar Batista Pires - 2015.pdf.txtExtracted Texttext/plain179286http://repositorio.bc.ufg.br/tede/bitstreams/edfed9ba-df6b-4c64-894d-8185456ba9da/download5798e741c07ea8527cc46a414b39bc2aMD56THUMBNAILDissertação - Julio Cesar Batista Pires - 2015.pdf.jpgDissertação - Julio Cesar Batista Pires - 2015.pdf.jpgGenerated Thumbnailimage/jpeg3518http://repositorio.bc.ufg.br/tede/bitstreams/03b0e2a3-04eb-4948-9e29-15ac24ed1d33/download06ac071239608010df70b2d68e03827cMD57tede/47232015-10-23 03:03:37.986http://creativecommons.org/licenses/by-nc-nd/4.0/Acesso Abertoopen.accessoai:repositorio.bc.ufg.br:tede/4723http://repositorio.bc.ufg.br/tedeRepositório InstitucionalPUBhttp://repositorio.bc.ufg.br/oai/requesttasesdissertacoes.bc@ufg.bropendoar:2015-10-23T05:03:37Repositório Institucional da UFG - Universidade Federal de Goiás (UFG)falseTk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo= |
dc.title.por.fl_str_mv |
Extração e mineração de informação independente de domínios da web na língua portuguesa |
dc.title.alternative.eng.fl_str_mv |
Extraction and mining domain independent information from web in portuguese |
title |
Extração e mineração de informação independente de domínios da web na língua portuguesa |
spellingShingle |
Extração e mineração de informação independente de domínios da web na língua portuguesa Pires, Julio Cesar Batista Web Semantica Extracao de informacao Mineracao de dados Semantic web Information extraction Data mining CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
title_short |
Extração e mineração de informação independente de domínios da web na língua portuguesa |
title_full |
Extração e mineração de informação independente de domínios da web na língua portuguesa |
title_fullStr |
Extração e mineração de informação independente de domínios da web na língua portuguesa |
title_full_unstemmed |
Extração e mineração de informação independente de domínios da web na língua portuguesa |
title_sort |
Extração e mineração de informação independente de domínios da web na língua portuguesa |
author |
Pires, Julio Cesar Batista |
author_facet |
Pires, Julio Cesar Batista |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Carvalho, Cedric Luiz de |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/4090131106212286 |
dc.contributor.referee1.fl_str_mv |
Carvalho, Cedric Luiz de |
dc.contributor.referee2.fl_str_mv |
Ambrósio, Ana Paula Laboissière |
dc.contributor.referee3.fl_str_mv |
Vieira, Renata |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/7687935305280678 |
dc.contributor.author.fl_str_mv |
Pires, Julio Cesar Batista |
contributor_str_mv |
Carvalho, Cedric Luiz de Carvalho, Cedric Luiz de Ambrósio, Ana Paula Laboissière Vieira, Renata |
dc.subject.por.fl_str_mv |
Web Semantica Extracao de informacao Mineracao de dados |
topic |
Web Semantica Extracao de informacao Mineracao de dados Semantic web Information extraction Data mining CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
dc.subject.eng.fl_str_mv |
Semantic web Information extraction Data mining |
dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
description |
Many people are constantly connected on the Web. They are looking for all kinds of things. The Web is a huge source of information. So, they can find almost everything they want. However, Web information is disorganized and have no formal structure. This hampers machine processing and consequently makes information access more difficult. Bringing structure to the Web can be one of the key points for facilitating user searching and navigation. A recent technique, Open Information Extraction, has been successfully applied to extract structured information from the Web. This technique has been mostly applied in pages written in English. This work is specifically focused on information extraction for Portuguese. Techniques used here can be also used to other languages too. |
publishDate |
2015 |
dc.date.accessioned.fl_str_mv |
2015-10-22T13:08:50Z |
dc.date.issued.fl_str_mv |
2015-05-08 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
PIRES, J. C. B. Extração e mineração de informação independente de domínios da web na língua portuguesa. 2015. 91 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2015. |
dc.identifier.uri.fl_str_mv |
http://repositorio.bc.ufg.br/tede/handle/tede/4723 |
dc.identifier.dark.fl_str_mv |
ark:/38995/00130000012mx |
identifier_str_mv |
PIRES, J. C. B. Extração e mineração de informação independente de domínios da web na língua portuguesa. 2015. 91 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Goiás, Goiânia, 2015. ark:/38995/00130000012mx |
url |
http://repositorio.bc.ufg.br/tede/handle/tede/4723 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.program.fl_str_mv |
-3303550325223384799 |
dc.relation.confidence.fl_str_mv |
600 600 600 600 |
dc.relation.department.fl_str_mv |
-7712266734633644768 |
dc.relation.cnpq.fl_str_mv |
3671711205811204509 |
dc.relation.sponsorship.fl_str_mv |
2075167498588264571 |
dc.rights.driver.fl_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
http://creativecommons.org/licenses/by-nc-nd/4.0/ |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.publisher.program.fl_str_mv |
Programa de Pós-graduação em Ciência da Computação (INF) |
dc.publisher.initials.fl_str_mv |
UFG |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Instituto de Informática - INF (RG) |
publisher.none.fl_str_mv |
Universidade Federal de Goiás |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFG instname:Universidade Federal de Goiás (UFG) instacron:UFG |
instname_str |
Universidade Federal de Goiás (UFG) |
instacron_str |
UFG |
institution |
UFG |
reponame_str |
Repositório Institucional da UFG |
collection |
Repositório Institucional da UFG |
bitstream.url.fl_str_mv |
http://repositorio.bc.ufg.br/tede/bitstreams/37f6e941-03de-4652-9d7f-79b6b398e0d4/download http://repositorio.bc.ufg.br/tede/bitstreams/c9637d01-6a8e-443c-af01-d1d94c2bcd51/download http://repositorio.bc.ufg.br/tede/bitstreams/ece702a7-9a56-40f7-9b77-77706f5c1431/download http://repositorio.bc.ufg.br/tede/bitstreams/e76f7b89-a821-4e05-a0a4-a7d463c84be4/download http://repositorio.bc.ufg.br/tede/bitstreams/e519afaf-10fb-4572-a7c2-9848132d11be/download http://repositorio.bc.ufg.br/tede/bitstreams/edfed9ba-df6b-4c64-894d-8185456ba9da/download http://repositorio.bc.ufg.br/tede/bitstreams/03b0e2a3-04eb-4948-9e29-15ac24ed1d33/download |
bitstream.checksum.fl_str_mv |
bd3efa91386c1718a7f26a329fdcb468 4afdbb8c545fd630ea7db775da747b2f 683d9883b2ad62ac3b8bafc566b2e600 9da0b6dfac957114c6a7714714b86306 dda6bea6dfa125f21d2023f288178ebc 5798e741c07ea8527cc46a414b39bc2a 06ac071239608010df70b2d68e03827c |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFG - Universidade Federal de Goiás (UFG) |
repository.mail.fl_str_mv |
tasesdissertacoes.bc@ufg.br |
_version_ |
1815172520307851264 |