FlexRank: um rankeador lexicográfico rápido
Autor(a) principal: | |
---|---|
Data de Publicação: | 2016 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFGD |
Texto Completo: | http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995 |
Resumo: | O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos. |
id |
UFGD-2_b164600d7a31e56ebea743d37f7e4f97 |
---|---|
oai_identifier_str |
oai:https://repositorio.ufgd.edu.br/jspui:prefix/2995 |
network_acronym_str |
UFGD-2 |
network_name_str |
Repositório Institucional da UFGD |
repository_id_str |
2116 |
spelling |
Matsubara, Edson Takashi0000-0002-4471-0886http://lattes.cnpq.br/1842905075999080Nogueira, Bruno Magalhãeshttp://lattes.cnpq.br/0544106600515308http://lattes.cnpq.br/6266978921240941Rodrigues, Lucas de Souza2020-05-11T13:55:25Z2020-05-11T13:55:25Z2016-06-29RODRIGUES, Lucas de Souza. FlexRank: um rankeador lexicográfico rápido. 2016. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Computação, Universidade Federal do Mato Grosso do Sul, Dourados, MS, 2016.http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995Submitted by Alison Souza (alisonsouza@ufgd.edu.br) on 2020-05-11T13:55:25Z No. of bitstreams: 1 UFMS - LucasdeSouzaRodrigues.pdf: 1157548 bytes, checksum: 52f2713e25abf67fb05dfd9f8179b42d (MD5)Made available in DSpace on 2020-05-11T13:55:25Z (GMT). No. of bitstreams: 1 UFMS - LucasdeSouzaRodrigues.pdf: 1157548 bytes, checksum: 52f2713e25abf67fb05dfd9f8179b42d (MD5) Previous issue date: 2016-06-29O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos.porUniversidade Federal de Mato Grosso do SulPrograma de pós-graduação em Ciência da ComputaçãoUFMSBrasilFaculdade de ComputaçãoCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOAprendizado de máquinaAlgoritmoLexicografiaMachine learningAlgorithmsLexicographyFlexRank: um rankeador lexicográfico rápidoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFGDinstname:Universidade Federal da Grande Dourados (UFGD)instacron:UFGDTEXTUFMS - LucasdeSouzaRodrigues.pdf.txtUFMS - LucasdeSouzaRodrigues.pdf.txtExtracted texttext/plain151523https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/3/UFMS%20-%20LucasdeSouzaRodrigues.pdf.txtc3b3fbca13d1a2978b3c6146850deda3MD53LICENSElicense.txtlicense.txttext/plain; charset=utf-81866https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/2/license.txt43cd690d6a359e86c1fe3d5b7cba0c9bMD52ORIGINALUFMS - LucasdeSouzaRodrigues.pdfUFMS - LucasdeSouzaRodrigues.pdfapplication/pdf1157548https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/1/UFMS%20-%20LucasdeSouzaRodrigues.pdf52f2713e25abf67fb05dfd9f8179b42dMD51prefix/29952023-09-14 02:16:11.677oai:https://repositorio.ufgd.edu.br/jspui:prefix/2995TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIApJbnN0aXR1Y2lvbmFsIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyLCAgdHJhZHV6aXIgKGNvbmZvcm1lIGRlZmluaWRvIGFiYWl4byksIGUvb3UgZGlzdHJpYnVpciBhIApzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIApmb3JtYXRvcyDDoXVkaW8gb3UgdsOtZGVvLgoKVm9jw6ogY29uY29yZGEgcXVlIG8gRGVwb3NpdGEgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIGEgc3VhIHB1YmxpY2HDp8OjbyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byAKcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIERlcG9zaXRhIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIAplIHByZXNlcnZhw6fDo28uCgpWb2PDqiBkZWNsYXJhIHF1ZSBhIHN1YSBwdWJsaWNhw6fDo28gw6kgb3JpZ2luYWwgZSBxdWUgdm9jw6ogdGVtIG8gcG9kZXIgZGUgY29uY2VkZXIgb3MgZGlyZWl0b3MgY29udGlkb3MgbmVzdGEgbGljZW7Dp2EuIApWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRhIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgCmRlIG5pbmd1w6ltLgoKQ2FzbyBhIHN1YSBwdWJsaWNhw6fDo28gY29udGVuaGEgbWF0ZXJpYWwgcXVlIHZvY8OqIG7Do28gcG9zc3VpIGEgdGl0dWxhcmlkYWRlIGRvcyBkaXJlaXRvcyBhdXRvcmFpcywgdm9jw6ogZGVjbGFyYSBxdWUgCm9idGV2ZSBhIHBlcm1pc3PDo28gaXJyZXN0cml0YSBkbyBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgcGFyYSBjb25jZWRlciBhbyBEZXBvc2l0YSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgCm5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIApvdSBubyBjb250ZcO6ZG8gZGEgcHVibGljYcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFBVQkxJQ0HDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSBBUE9JTyBERSBVTUEgQUfDik5DSUEgREUgRk9NRU5UTyBPVSBPVVRSTyAKT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgCkVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpPIERlcG9zaXRhIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUgKHMpIG91IG8ocykgbm9tZShzKSBkbyhzKSBkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIAphdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttps://repositorio.ufgd.edu.br/jspui:8080/oai/requestopendoar:21162023-09-14T06:16:11Repositório Institucional da UFGD - Universidade Federal da Grande Dourados (UFGD)false |
dc.title.pt_BR.fl_str_mv |
FlexRank: um rankeador lexicográfico rápido |
title |
FlexRank: um rankeador lexicográfico rápido |
spellingShingle |
FlexRank: um rankeador lexicográfico rápido Rodrigues, Lucas de Souza CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de máquina Algoritmo Lexicografia Machine learning Algorithms Lexicography |
title_short |
FlexRank: um rankeador lexicográfico rápido |
title_full |
FlexRank: um rankeador lexicográfico rápido |
title_fullStr |
FlexRank: um rankeador lexicográfico rápido |
title_full_unstemmed |
FlexRank: um rankeador lexicográfico rápido |
title_sort |
FlexRank: um rankeador lexicográfico rápido |
author |
Rodrigues, Lucas de Souza |
author_facet |
Rodrigues, Lucas de Souza |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Matsubara, Edson Takashi |
dc.contributor.advisor1ID.fl_str_mv |
0000-0002-4471-0886 |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/1842905075999080 |
dc.contributor.advisor-co1.fl_str_mv |
Nogueira, Bruno Magalhães |
dc.contributor.advisor-co1Lattes.fl_str_mv |
http://lattes.cnpq.br/0544106600515308 |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/6266978921240941 |
dc.contributor.author.fl_str_mv |
Rodrigues, Lucas de Souza |
contributor_str_mv |
Matsubara, Edson Takashi Nogueira, Bruno Magalhães |
dc.subject.cnpq.fl_str_mv |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
topic |
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO Aprendizado de máquina Algoritmo Lexicografia Machine learning Algorithms Lexicography |
dc.subject.por.fl_str_mv |
Aprendizado de máquina Algoritmo Lexicografia |
dc.subject.eng.fl_str_mv |
Machine learning Algorithms Lexicography |
description |
O uso de Aprendizado de Máquina (AM), tem sido amplamente utilizado em problemas reais nos últimos anos. Este trabalho propõe o uso de técnicas em AM para problemas com dados textuais, com abordagem em algoritmos baseados em regras lexicográficas e legitimamente rankeadores. Com a popularização dos dados em meio digitais, torna-se interessante aplicar técnicas de AM para melhor organizar as informações contidas neste vasto campo de bases textuais. O aprendizado supervisionado, uma área de AM, com uso de algoritmos de rankeamento é uma alternativa viável para ambientes que possuem poucos dados rotulados. Logo, para alcançar os desafios deste trabalho é proposto o algoritmo FLEXRANK que tem o objetivo de rankear conjuntos textuais massivos. Para realizar tal feito FLEXRANK conta com uma estratégia simples que utiliza apenas atributos relevantes e por conseguinte realiza lexicograficamente a ordenação dos exemplos em um conjunto de dados. Deste modo, inicialmente são apresentados os tipos de algoritmos de AM, medidas de avaliação em algoritmos de classificação, rankeamento e abordagem dos algoritmos LEXRANK e FLEXRANK proposto neste trabalho. Trabalhos que possuem correlação de ranking de textos, especialmente aqueles que atuam em mineração de textos, são abordados neste estudo. Destaca-se também estudos anteriores com foco a balizar os experimentos e resultados acalçados ao longo deste trabalho. FLEXRANK foi avaliado empiricamente sobre uma série de conjuntos de dados em comparação com os algoritmos SVM, Árvores de Decisão, Naive Bayes, KNN e LEXRANK. Os resultados demonstram que para os problemas de classificação de textos massivos, FLEXRANK tem resultados comparáveis, por meio de Curva ROC AUC, a SVM e mais rápido do que Árvores de Decisão para classificar novos exemplos. |
publishDate |
2016 |
dc.date.issued.fl_str_mv |
2016-06-29 |
dc.date.accessioned.fl_str_mv |
2020-05-11T13:55:25Z |
dc.date.available.fl_str_mv |
2020-05-11T13:55:25Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
RODRIGUES, Lucas de Souza. FlexRank: um rankeador lexicográfico rápido. 2016. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Computação, Universidade Federal do Mato Grosso do Sul, Dourados, MS, 2016. |
dc.identifier.uri.fl_str_mv |
http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995 |
identifier_str_mv |
RODRIGUES, Lucas de Souza. FlexRank: um rankeador lexicográfico rápido. 2016. Dissertação (Mestrado em Ciência da Computação) – Faculdade de Computação, Universidade Federal do Mato Grosso do Sul, Dourados, MS, 2016. |
url |
http://repositorio.ufgd.edu.br/jspui/handle/prefix/2995 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Mato Grosso do Sul |
dc.publisher.program.fl_str_mv |
Programa de pós-graduação em Ciência da Computação |
dc.publisher.initials.fl_str_mv |
UFMS |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Faculdade de Computação |
publisher.none.fl_str_mv |
Universidade Federal de Mato Grosso do Sul |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFGD instname:Universidade Federal da Grande Dourados (UFGD) instacron:UFGD |
instname_str |
Universidade Federal da Grande Dourados (UFGD) |
instacron_str |
UFGD |
institution |
UFGD |
reponame_str |
Repositório Institucional da UFGD |
collection |
Repositório Institucional da UFGD |
bitstream.url.fl_str_mv |
https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/3/UFMS%20-%20LucasdeSouzaRodrigues.pdf.txt https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/2/license.txt https://repositorio.ufgd.edu.br/jspui/bitstream/prefix/2995/1/UFMS%20-%20LucasdeSouzaRodrigues.pdf |
bitstream.checksum.fl_str_mv |
c3b3fbca13d1a2978b3c6146850deda3 43cd690d6a359e86c1fe3d5b7cba0c9b 52f2713e25abf67fb05dfd9f8179b42d |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFGD - Universidade Federal da Grande Dourados (UFGD) |
repository.mail.fl_str_mv |
|
_version_ |
1798042077153460224 |