Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros

Detalhes bibliográficos
Autor(a) principal: Santos, Daniel Lopes Braz dos
Data de Publicação: 2017
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFRJ
Texto Completo: http://hdl.handle.net/11422/9594
Resumo: Com o aumento da discussão e interesse sobre política, tanto pela sociedade como por especialistas, surge a necessidade de se analisar, estudar e acompanhar as ações realizadas pelo legislativo e executivo. Mas o grande volume de documentos, projetos de lei, assim como seu tamanho e padrão de escrita e layout, acabam dificultando este processo. Vê-se a necessidade de uma ferramenta que consiga identificar a agrupar cada tema de projeto e separa estes documentos quanto as suas polaridades em relação ao tema identificado. O objetivo desta dissertação é apresentar a pesquisa de uma metodologia eficiente de identificação de polaridade e similaridade de documentos sobre um mesmo tema, usando como estudo de caso projetos de lei contra e a favor da liberalização do aborto no Brasil. Busca-se primeiramente identificar e comparar técnicas de aprendizado de máquinas sobre textos que consigam classificar os projetos nestes dois vieses citados. Esta metodologia analisa cada parte do projeto em questão, utilizando a técnica de agrupamento K-means, aplicando em seguida um método baseado em grafos para processar todas as combinações de parâmetros e verificar os projetos que possuem maiores ligações entre si. Para a realização de teste foram utilizados projetos previamente classificados e os resultados obtidos com esta metodologia demonstraram ligações e peculiaridades muito interessantes e promissoras, ajudando assim, na identificação de similaridades e padrões em documentos.
id UFRJ_efbb80b4e77dad4a9070394d8784a338
oai_identifier_str oai:pantheon.ufrj.br:11422/9594
network_acronym_str UFRJ
network_name_str Repositório Institucional da UFRJ
repository_id_str
spelling Santos, Daniel Lopes Braz doshttp://lattes.cnpq.br/1815602660190377Coeli, Claudia MedinaAragão, Myriam Christina deEbecken, Nelson Francisco Favilla2019-09-16T15:23:19Z2023-11-30T03:03:36Z2017-12http://hdl.handle.net/11422/9594Com o aumento da discussão e interesse sobre política, tanto pela sociedade como por especialistas, surge a necessidade de se analisar, estudar e acompanhar as ações realizadas pelo legislativo e executivo. Mas o grande volume de documentos, projetos de lei, assim como seu tamanho e padrão de escrita e layout, acabam dificultando este processo. Vê-se a necessidade de uma ferramenta que consiga identificar a agrupar cada tema de projeto e separa estes documentos quanto as suas polaridades em relação ao tema identificado. O objetivo desta dissertação é apresentar a pesquisa de uma metodologia eficiente de identificação de polaridade e similaridade de documentos sobre um mesmo tema, usando como estudo de caso projetos de lei contra e a favor da liberalização do aborto no Brasil. Busca-se primeiramente identificar e comparar técnicas de aprendizado de máquinas sobre textos que consigam classificar os projetos nestes dois vieses citados. Esta metodologia analisa cada parte do projeto em questão, utilizando a técnica de agrupamento K-means, aplicando em seguida um método baseado em grafos para processar todas as combinações de parâmetros e verificar os projetos que possuem maiores ligações entre si. Para a realização de teste foram utilizados projetos previamente classificados e os resultados obtidos com esta metodologia demonstraram ligações e peculiaridades muito interessantes e promissoras, ajudando assim, na identificação de similaridades e padrões em documentos.With the increase of discussion and interest in politics, both by society and by specialists, come up the need to analyze, study end follow the legislative’s and executive’s actions. But the large number of documents , draft laws, as well as their layout and writing pattern, makes this a difficult process. The necessity of identifying and clustering each draft law subject and separate these documents by their polarities in relation to the identified theme. The goal of this dissertation is to build an efficient methodology for document polarity and similarity identification, over the same subject. Brazilian draft laws on abortion liberalization were analyzed as case study. The first step is to identify and compare different machine learning techniques the can sort law projects on both against and in favor bias. The methodology analyses each part of the document, utilizing K-means grouping, to later apply a graph based process on every parameter combination certify the drafts have more connection among each other. To perform tests, previously classified draft laws manually sorted by a specialist were used and all results obtained with this method demonstrated very interesting an promising connections and peculiarities, thus helping to identify similarities and patterns in documents.Submitted by Christianne Fontes de Andrade (cfontes@ct.ufrj.br) on 2019-09-16T15:23:19Z No. of bitstreams: 1 876433.pdf: 923172 bytes, checksum: 18ac0bbe8541588b98d15dc47acce8f3 (MD5)Made available in DSpace on 2019-09-16T15:23:19Z (GMT). No. of bitstreams: 1 876433.pdf: 923172 bytes, checksum: 18ac0bbe8541588b98d15dc47acce8f3 (MD5) Previous issue date: 2017-12porUniversidade Federal do Rio de JaneiroPrograma de Pós-Graduação em Engenharia CivilUFRJBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaCNPQ::ENGENHARIAS::ENGENHARIA CIVILEngenharia CivilClusterizaçãoPolarização de textosMetodologia de identificação de polaridade en textos com base em projetos de lei brasileirosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisabertoinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJORIGINAL876433.pdf876433.pdfapplication/pdf923172http://pantheon.ufrj.br:80/bitstream/11422/9594/1/876433.pdf18ac0bbe8541588b98d15dc47acce8f3MD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81853http://pantheon.ufrj.br:80/bitstream/11422/9594/2/license.txtdd32849f2bfb22da963c3aac6e26e255MD5211422/95942023-11-30 00:03:36.512oai:pantheon.ufrj.br:11422/9594TElDRU7Dh0EgTsODTy1FWENMVVNJVkEgREUgRElTVFJJQlVJw4fDg08KCkFvIGFzc2luYXIgZSBlbnRyZWdhciBlc3RhIGxpY2Vuw6dhLCB2b2PDqihzKSBvKHMpIGF1dG9yKGVzKSBvdSBwcm9wcmlldMOhcmlvKHMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBjb25jZWRlKG0pIGFvIFJlcG9zaXTDs3JpbyBQYW50aGVvbiBkYSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkbyBSaW8gZGUgSmFuZWlybyAoVUZSSikgbyBkaXJlaXRvIG7Do28gLSBleGNsdXNpdm8gZGUgcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vKSBlbSB0b2RvIG8gbXVuZG8sIGVtIGZvcm1hdG8gZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8sIG1hcyBuw6NvIGxpbWl0YWRvIGEgw6F1ZGlvIGUvb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIGEgVUZSSiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhZHV6aXIgYSBhcHJlc2VudGHDp8OjbyBkZSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gY29tIGEgZmluYWxpZGFkZSBkZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogdGFtYsOpbSBjb25jb3JkYSBxdWUgYSBVRlJKIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXNzYSBzdWJtaXNzw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8OjbyBkaWdpdGFsLgoKRGVjbGFyYSBxdWUgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgc2V1IHRyYWJhbGhvIG9yaWdpbmFsLCBlIHF1ZSB2b2PDqiB0ZW0gbyBkaXJlaXRvIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIGEgc3VhIGFwcmVzZW50YcOnw6NvLCBjb20gbyBtZWxob3IgZGUgc2V1cyBjb25oZWNpbWVudG9zLCBuw6NvIGluZnJpbmdpIGRpcmVpdG9zIGF1dG9yYWlzIGRlIHRlcmNlaXJvcy4KClNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIGNvbnTDqW0gbWF0ZXJpYWwgZG8gcXVhbCB2b2PDqiBuw6NvIHRlbSBkaXJlaXRvcyBkZSBhdXRvciwgZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBlIGNvbmNlZGUgYSBVRlJKIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRhIHN1Ym1pc3PDo28uCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIHF1ZSBmb2ksIG91IHRlbSBzaWRvIHBhdHJvY2luYWRvIG91IGFwb2lhZG8gcG9yIHVtYSBhZ8OqbmNpYSBvdSBvdXRybyhzKSBvcmdhbmlzbW8ocykgcXVlIG7Do28gYSBVRlJKLCB2b2PDqiBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWxxdWVyIGRpcmVpdG8gZGUgUkVWSVPDg08gb3UgZGUgb3V0cmFzIG9icmlnYcOnw7VlcyByZXF1ZXJpZGFzIHBvciBjb250cmF0byBvdSBhY29yZG8uCgpBIFVGUkogaXLDoSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8ocykgc2V1KHMpIG5vbWUocykgY29tbyBhdXRvcihlcykgb3UgcHJvcHJpZXTDoXJpbyhzKSBkYSBzdWJtaXNzw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZGFzIHBlcm1pdGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EsIG5vIGF0byBkZSBzdWJtaXNzw6NvLgo=Repositório de PublicaçõesPUBhttp://www.pantheon.ufrj.br/oai/requestopendoar:2023-11-30T03:03:36Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false
dc.title.pt_BR.fl_str_mv Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
title Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
spellingShingle Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
Santos, Daniel Lopes Braz dos
CNPQ::ENGENHARIAS::ENGENHARIA CIVIL
Engenharia Civil
Clusterização
Polarização de textos
title_short Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
title_full Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
title_fullStr Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
title_full_unstemmed Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
title_sort Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
author Santos, Daniel Lopes Braz dos
author_facet Santos, Daniel Lopes Braz dos
author_role author
dc.contributor.authorLattes.pt_BR.fl_str_mv http://lattes.cnpq.br/1815602660190377
dc.contributor.author.fl_str_mv Santos, Daniel Lopes Braz dos
dc.contributor.referee1.fl_str_mv Coeli, Claudia Medina
dc.contributor.referee2.fl_str_mv Aragão, Myriam Christina de
dc.contributor.advisor1.fl_str_mv Ebecken, Nelson Francisco Favilla
contributor_str_mv Coeli, Claudia Medina
Aragão, Myriam Christina de
Ebecken, Nelson Francisco Favilla
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA CIVIL
topic CNPQ::ENGENHARIAS::ENGENHARIA CIVIL
Engenharia Civil
Clusterização
Polarização de textos
dc.subject.por.fl_str_mv Engenharia Civil
Clusterização
Polarização de textos
description Com o aumento da discussão e interesse sobre política, tanto pela sociedade como por especialistas, surge a necessidade de se analisar, estudar e acompanhar as ações realizadas pelo legislativo e executivo. Mas o grande volume de documentos, projetos de lei, assim como seu tamanho e padrão de escrita e layout, acabam dificultando este processo. Vê-se a necessidade de uma ferramenta que consiga identificar a agrupar cada tema de projeto e separa estes documentos quanto as suas polaridades em relação ao tema identificado. O objetivo desta dissertação é apresentar a pesquisa de uma metodologia eficiente de identificação de polaridade e similaridade de documentos sobre um mesmo tema, usando como estudo de caso projetos de lei contra e a favor da liberalização do aborto no Brasil. Busca-se primeiramente identificar e comparar técnicas de aprendizado de máquinas sobre textos que consigam classificar os projetos nestes dois vieses citados. Esta metodologia analisa cada parte do projeto em questão, utilizando a técnica de agrupamento K-means, aplicando em seguida um método baseado em grafos para processar todas as combinações de parâmetros e verificar os projetos que possuem maiores ligações entre si. Para a realização de teste foram utilizados projetos previamente classificados e os resultados obtidos com esta metodologia demonstraram ligações e peculiaridades muito interessantes e promissoras, ajudando assim, na identificação de similaridades e padrões em documentos.
publishDate 2017
dc.date.issued.fl_str_mv 2017-12
dc.date.accessioned.fl_str_mv 2019-09-16T15:23:19Z
dc.date.available.fl_str_mv 2023-11-30T03:03:36Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/11422/9594
url http://hdl.handle.net/11422/9594
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.publisher.program.fl_str_mv Programa de Pós-Graduação em Engenharia Civil
dc.publisher.initials.fl_str_mv UFRJ
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
publisher.none.fl_str_mv Universidade Federal do Rio de Janeiro
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFRJ
instname:Universidade Federal do Rio de Janeiro (UFRJ)
instacron:UFRJ
instname_str Universidade Federal do Rio de Janeiro (UFRJ)
instacron_str UFRJ
institution UFRJ
reponame_str Repositório Institucional da UFRJ
collection Repositório Institucional da UFRJ
bitstream.url.fl_str_mv http://pantheon.ufrj.br:80/bitstream/11422/9594/1/876433.pdf
http://pantheon.ufrj.br:80/bitstream/11422/9594/2/license.txt
bitstream.checksum.fl_str_mv 18ac0bbe8541588b98d15dc47acce8f3
dd32849f2bfb22da963c3aac6e26e255
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)
repository.mail.fl_str_mv
_version_ 1784097156547739648