FlexRank: um rankeador lexicográfico rápido

Detalhes bibliográficos
Autor(a) principal: Rodrigues, Lucas de Souza
Data de Publicação: 2016
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Institucional da UFGD
Texto Completo: http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995
Resumo: O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.
id UFGD-2_b164600d7a31e56ebea743d37f7e4f97
oai_identifier_str oai:https://repositorio.ufgd.edu.br/jspui:prefix/2995
network_acronym_str UFGD-2
network_name_str Repositório Institucional da UFGD
repository_id_str 2116
spelling Matsubara, Edson Takashi0000-0002-4471-0886http://lattes.cnpq.br/1842905075999080Nogueira, Bruno Magalhãeshttp://lattes.cnpq.br/0544106600515308http://lattes.cnpq.br/6266978921240941Rodrigues, Lucas de Souza2020-05-11T13:55:25Z2020-05-11T13:55:25Z2016-06-29RODRIGUES, Lucas de Souza. FlexRank: um rankeador lexicográfico rápido. 2016. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Computação, Universidade Federal do Mato Grosso do Sul, Dourados, MS, 2016.http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995Submitted by Alison Souza (alisonsouza@ufgd.edu.br) on 2020-05-11T13:55:25Z No. of bitstreams: 1 UFMS - LucasdeSouzaRodrigues.pdf: 1157548 bytes, checksum: 52f2713e25abf67fb05dfd9f8179b42d (MD5)Made available in DSpace on 2020-05-11T13:55:25Z (GMT). No. of bitstreams: 1 UFMS - LucasdeSouzaRodrigues.pdf: 1157548 bytes, checksum: 52f2713e25abf67fb05dfd9f8179b42d (MD5) Previous issue date: 2016-06-29O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.porUniversidade Federal de Mato Grosso do SulPrograma de pós-graduação em Ciência da ComputaçãoUFMSBrasilFaculdade de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de máquinaAlgoritmoLexicografiaMachine learningAlgorithmsLexicographyFlexRank: um rankeador lexicográfico rápidoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFGDinstname:Universidade Federal da Grande Dourados (UFGD)instacron:UFGDTEXTUFMS - LucasdeSouzaRodrigues.pdf.txtUFMS - LucasdeSouzaRodrigues.pdf.txtExtracted texttext/plain151523https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/3/UFMS%20-%20LucasdeSouzaRodrigues.pdf.txtc3b3fbca13d1a2978b3c6146850deda3MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81866https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52ORIGINALUFMS - LucasdeSouzaRodrigues.pdfUFMS - LucasdeSouzaRodrigues.pdfapplication/pdf1157548https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/1/UFMS%20-%20LucasdeSouzaRodrigues.pdf52f2713e25abf67fb05dfd9f8179b42dMD51prefix/29952023-09-14 02:16:11.677oai:https://repositorio.ufgd.edu.br/jspui:prefix/2995TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttps://repositorio.ufgd.edu.br/jspui:8080/oai/requestopendoar:21162023-09-14T06:16:11Repositório Institucional da UFGD - Universidade Federal da Grande Dourados (UFGD)false
dc.title.pt_BR.fl_str_mv FlexRank: um rankeador lexicográfico rápido
title FlexRank: um rankeador lexicográfico rápido
spellingShingle FlexRank: um rankeador lexicográfico rápido
Rodrigues, Lucas de Souza
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado de máquina
Algoritmo
Lexicografia
Machine learning
Algorithms
Lexicography
title_short FlexRank: um rankeador lexicográfico rápido
title_full FlexRank: um rankeador lexicográfico rápido
title_fullStr FlexRank: um rankeador lexicográfico rápido
title_full_unstemmed FlexRank: um rankeador lexicográfico rápido
title_sort FlexRank: um rankeador lexicográfico rápido
author Rodrigues, Lucas de Souza
author_facet Rodrigues, Lucas de Souza
author_role author
dc.contributor.advisor1.fl_str_mv Matsubara, Edson Takashi
dc.contributor.advisor1ID.fl_str_mv 0000-0002-4471-0886
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/1842905075999080
dc.contributor.advisor-co1.fl_str_mv Nogueira, Bruno Magalhães
dc.contributor.advisor-co1Lattes.fl_str_mv http://lattes.cnpq.br/0544106600515308
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/6266978921240941
dc.contributor.author.fl_str_mv Rodrigues, Lucas de Souza
contributor_str_mv Matsubara, Edson Takashi
Nogueira, Bruno Magalhães
dc.subject.cnpq.fl_str_mv CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Aprendizado de máquina
Algoritmo
Lexicografia
Machine learning
Algorithms
Lexicography
dc.subject.por.fl_str_mv Aprendizado de máquina
Algoritmo
Lexicografia
dc.subject.eng.fl_str_mv Machine learning
Algorithms
Lexicography
description O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.
publishDate 2016
dc.date.issued.fl_str_mv 2016-06-29
dc.date.accessioned.fl_str_mv 2020-05-11T13:55:25Z
dc.date.available.fl_str_mv 2020-05-11T13:55:25Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv RODRIGUES, Lucas de Souza. FlexRank: um rankeador lexicográfico rápido. 2016. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Computação, Universidade Federal do Mato Grosso do Sul, Dourados, MS, 2016.
dc.identifier.uri.fl_str_mv http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995
identifier_str_mv RODRIGUES, Lucas de Souza. FlexRank: um rankeador lexicográfico rápido. 2016. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Computação, Universidade Federal do Mato Grosso do Sul, Dourados, MS, 2016.
url http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal de Mato Grosso do Sul
dc.publisher.program.fl_str_mv Programa de pós-graduação em Ciência da Computação
dc.publisher.initials.fl_str_mv UFMS
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Faculdade de Computação
publisher.none.fl_str_mv Universidade Federal de Mato Grosso do Sul
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFGD
instname:Universidade Federal da Grande Dourados (UFGD)
instacron:UFGD
instname_str Universidade Federal da Grande Dourados (UFGD)
instacron_str UFGD
institution UFGD
reponame_str Repositório Institucional da UFGD
collection Repositório Institucional da UFGD
bitstream.url.fl_str_mv https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/3/UFMS%20-%20LucasdeSouzaRodrigues.pdf.txt
https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/2/license.txt
https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/1/UFMS%20-%20LucasdeSouzaRodrigues.pdf
bitstream.checksum.fl_str_mv c3b3fbca13d1a2978b3c6146850deda3
43cd690d6a359e86c1fe3d5b7cba0c9b
52f2713e25abf67fb05dfd9f8179b42d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFGD - Universidade Federal da Grande Dourados (UFGD)
repository.mail.fl_str_mv
_version_ 1798042077153460224