Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros
Autor(a) principal: | |
---|---|
Data de Publicação: | 2017 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFRJ |
Texto Completo: | http://hdl.handle.net/11422/9594 |
Resumo: | With the increase of discussion and interest in politics, both by society and by specialists, come up the need to analyze, study end follow the legislative’s and executive’s actions. But the large number of documents , draft laws, as well as their layout and writing pattern, makes this a difficult process. The necessity of identifying and clustering each draft law subject and separate these documents by their polarities in relation to the identified theme. The goal of this dissertation is to build an efficient methodology for document polarity and similarity identification, over the same subject. Brazilian draft laws on abortion liberalization were analyzed as case study. The first step is to identify and compare different machine learning techniques the can sort law projects on both against and in favor bias. The methodology analyses each part of the document, utilizing K-means grouping, to later apply a graph based process on every parameter combination certify the drafts have more connection among each other. To perform tests, previously classified draft laws manually sorted by a specialist were used and all results obtained with this method demonstrated very interesting an promising connections and peculiarities, thus helping to identify similarities and patterns in documents. |
id |
UFRJ_efbb80b4e77dad4a9070394d8784a338 |
---|---|
oai_identifier_str |
oai:pantheon.ufrj.br:11422/9594 |
network_acronym_str |
UFRJ |
network_name_str |
Repositório Institucional da UFRJ |
repository_id_str |
|
spelling |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileirosEngenharia CivilClusterizaçãoPolarização de textosCNPQ::ENGENHARIAS::ENGENHARIA CIVILWith the increase of discussion and interest in politics, both by society and by specialists, come up the need to analyze, study end follow the legislative’s and executive’s actions. But the large number of documents , draft laws, as well as their layout and writing pattern, makes this a difficult process. The necessity of identifying and clustering each draft law subject and separate these documents by their polarities in relation to the identified theme. The goal of this dissertation is to build an efficient methodology for document polarity and similarity identification, over the same subject. Brazilian draft laws on abortion liberalization were analyzed as case study. The first step is to identify and compare different machine learning techniques the can sort law projects on both against and in favor bias. The methodology analyses each part of the document, utilizing K-means grouping, to later apply a graph based process on every parameter combination certify the drafts have more connection among each other. To perform tests, previously classified draft laws manually sorted by a specialist were used and all results obtained with this method demonstrated very interesting an promising connections and peculiarities, thus helping to identify similarities and patterns in documents.Com o aumento da discussão e interesse sobre política, tanto pela sociedade como por especialistas, surge a necessidade de se analisar, estudar e acompanhar as ações realizadas pelo legislativo e executivo. Mas o grande volume de documentos, projetos de lei, assim como seu tamanho e padrão de escrita e layout, acabam dificultando este processo. Vê-se a necessidade de uma ferramenta que consiga identificar a agrupar cada tema de projeto e separa estes documentos quanto as suas polaridades em relação ao tema identificado. O objetivo desta dissertação é apresentar a pesquisa de uma metodologia eficiente de identificação de polaridade e similaridade de documentos sobre um mesmo tema, usando como estudo de caso projetos de lei contra e a favor da liberalização do aborto no Brasil. Busca-se primeiramente identificar e comparar técnicas de aprendizado de máquinas sobre textos que consigam classificar os projetos nestes dois vieses citados. Esta metodologia analisa cada parte do projeto em questão, utilizando a técnica de agrupamento K-means, aplicando em seguida um método baseado em grafos para processar todas as combinações de parâmetros e verificar os projetos que possuem maiores ligações entre si. Para a realização de teste foram utilizados projetos previamente classificados e os resultados obtidos com esta metodologia demonstraram ligações e peculiaridades muito interessantes e promissoras, ajudando assim, na identificação de similaridades e padrões em documentos.Universidade Federal do Rio de JaneiroBrasilInstituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de EngenhariaPrograma de Pós-Graduação em Engenharia CivilUFRJEbecken, Nelson Francisco Favillahttp://lattes.cnpq.br/1815602660190377Coeli, Claudia MedinaAragão, Myriam Christina deSantos, Daniel Lopes Braz dos2019-09-16T15:23:19Z2023-12-21T03:06:15Z2017-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttp://hdl.handle.net/11422/9594porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFRJinstname:Universidade Federal do Rio de Janeiro (UFRJ)instacron:UFRJ2023-12-21T03:06:15Zoai:pantheon.ufrj.br:11422/9594Repositório InstitucionalPUBhttp://www.pantheon.ufrj.br/oai/requestpantheon@sibi.ufrj.bropendoar:2023-12-21T03:06:15Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ)false |
dc.title.none.fl_str_mv |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros |
title |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros |
spellingShingle |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros Santos, Daniel Lopes Braz dos Engenharia Civil Clusterização Polarização de textos CNPQ::ENGENHARIAS::ENGENHARIA CIVIL |
title_short |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros |
title_full |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros |
title_fullStr |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros |
title_full_unstemmed |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros |
title_sort |
Metodologia de identificação de polaridade en textos com base em projetos de lei brasileiros |
author |
Santos, Daniel Lopes Braz dos |
author_facet |
Santos, Daniel Lopes Braz dos |
author_role |
author |
dc.contributor.none.fl_str_mv |
Ebecken, Nelson Francisco Favilla http://lattes.cnpq.br/1815602660190377 Coeli, Claudia Medina Aragão, Myriam Christina de |
dc.contributor.author.fl_str_mv |
Santos, Daniel Lopes Braz dos |
dc.subject.por.fl_str_mv |
Engenharia Civil Clusterização Polarização de textos CNPQ::ENGENHARIAS::ENGENHARIA CIVIL |
topic |
Engenharia Civil Clusterização Polarização de textos CNPQ::ENGENHARIAS::ENGENHARIA CIVIL |
description |
With the increase of discussion and interest in politics, both by society and by specialists, come up the need to analyze, study end follow the legislative’s and executive’s actions. But the large number of documents , draft laws, as well as their layout and writing pattern, makes this a difficult process. The necessity of identifying and clustering each draft law subject and separate these documents by their polarities in relation to the identified theme. The goal of this dissertation is to build an efficient methodology for document polarity and similarity identification, over the same subject. Brazilian draft laws on abortion liberalization were analyzed as case study. The first step is to identify and compare different machine learning techniques the can sort law projects on both against and in favor bias. The methodology analyses each part of the document, utilizing K-means grouping, to later apply a graph based process on every parameter combination certify the drafts have more connection among each other. To perform tests, previously classified draft laws manually sorted by a specialist were used and all results obtained with this method demonstrated very interesting an promising connections and peculiarities, thus helping to identify similarities and patterns in documents. |
publishDate |
2017 |
dc.date.none.fl_str_mv |
2017-12 2019-09-16T15:23:19Z 2023-12-21T03:06:15Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/11422/9594 |
url |
http://hdl.handle.net/11422/9594 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia Civil UFRJ |
publisher.none.fl_str_mv |
Universidade Federal do Rio de Janeiro Brasil Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia Programa de Pós-Graduação em Engenharia Civil UFRJ |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFRJ instname:Universidade Federal do Rio de Janeiro (UFRJ) instacron:UFRJ |
instname_str |
Universidade Federal do Rio de Janeiro (UFRJ) |
instacron_str |
UFRJ |
institution |
UFRJ |
reponame_str |
Repositório Institucional da UFRJ |
collection |
Repositório Institucional da UFRJ |
repository.name.fl_str_mv |
Repositório Institucional da UFRJ - Universidade Federal do Rio de Janeiro (UFRJ) |
repository.mail.fl_str_mv |
pantheon@sibi.ufrj.br |
_version_ |
1815455995805040640 |