Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais

Detalhes bibliográficos
Autor(a) principal: Sérgio, Marina Carradore
Data de Publicação: 2013
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFSC
Texto Completo: https://repositorio.ufsc.br/handle/123456789/105488
Resumo: TCC (graduação) - Universidade Federal de Santa Catarina, Campus Araranguá, Curso de Tecnologias da Informação e Comunicação.
id UFSC_1f84af26284bde9d187155cfb87cd8b3
oai_identifier_str oai:repositorio.ufsc.br:123456789/105488
network_acronym_str UFSC
network_name_str Repositório Institucional da UFSC
repository_id_str 2373
spelling Universidade Federal de Santa Catarina. Campus AraranguáSérgio, Marina CarradoreGonçalves, Alexandre Leopoldo2013-10-30T17:38:39Z2013-10-30T17:38:39Z2013-07-202013-07-20https://repositorio.ufsc.br/handle/123456789/105488TCC (graduação) - Universidade Federal de Santa Catarina, Campus Araranguá, Curso de Tecnologias da Informação e Comunicação.Atualmente, o volume de informação gerado aumenta em escala exponencial, sendo que grande parte desta informação encontra-se na forma textual. Através deste formato é possível extrair ativos de conhecimento, ou seja, regras, padrões, tendências, redes, capazes de auxiliar no processo de tomada de decisão dentro das organizações com o intuito de gerar vantagem competitiva. Em virtude da grande disponibilidade de documentos textuais, seja na web ou mesmo nas organizações, assim como, a falta de padronização dos mesmos, tal tarefa constitui-se em um desafio computacional. Neste sentido, é necessário o devido pré-processamento e adequação dos dados. Um meio de se extrair tais ativos de conhecimento é através do processo de Descoberta de Conhecimento em Textos. A partir disto, propõem-se neste trabalho uma arquitetura para descoberta de conhecimento em bases textuais que seja capaz de revelar relacionamentos diretos e indiretos entre padrões textuais (termos) e que tenha suporte da Computação Distribuída. A demonstração de viabilidade é realizada através de um protótipo desenvolvido com base na arquitetura proposta. Como principal resultado do trabalho menciona-se a apresentação da interconexão temporal entre termos através do conceito de associação indireta e posteriormente correlação (associação direta). Além disto, pode-se afirmar que, tanto as distribuições de frequência de um termo quanto os mapas de tópicos, ambos baseados na dimensão tempo, auxiliam no entendimento de determinado domínio do problema. Por fim, a aplicação do protótipo em um cenário permitiu demonstrar que a arquitetura proposta neste trabalho é capaz de atingir resultados consistentes e satisfatórios no que se refere ao entendimento de determinado domínio a partir bases textuaisCurrently the volume of information generated increases in exponential scale. Much of this information is in natural language. Through this format is possible to extract knowledge able to assist the decision making process within organizations in order to generate competitive advantage. Due to the wide availability of textual documents on the web or even in organizations and the lack of standards about document structures such task is a computational challenge. Thus, it is required a suitable data pre-processing. A way to extract such knowledge assets is through the Knowledge Discovery in Texts process. Take it into account we propose in this work an architecture supported by distributed computing for knowledge discovery in textual databases which be able to reveal direct and indirect relationships between textual patterns (terms). The demonstration of feasibility is carried out by a prototype based on the proposed architecture. The main result of this work refers to the demonstration of temporal interconnections among terms through the concepts of indirect association and subsequently correlation (direct association). Moreover, it can be stated that the frequency distributions of a term and topic maps, both based on the temporal vision, help in the understanding of a specific domain problem. Finally, the prototype applied in a scenario has demonstrated that the proposed architecture is able to achieve consistent and satisfactory results towards the understanding of a given domain.125p.Descoberta do conhecimentoBases textuaisRelacionamentos indiretosComputação distribuídaUma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisporreponame:Repositório Institucional da UFSCinstname:Universidade Federal de Santa Catarina (UFSC)instacron:UFSCinfo:eu-repo/semantics/openAccessORIGINALTCC-Marina-Final_Com_Ficha.pdfTCC-Marina-Final_Com_Ficha.pdfapplication/pdf2273256https://repositorio.ufsc.br/bitstream/123456789/105488/1/TCC-Marina-Final_Com_Ficha.pdf376619498bcbb876ea5da9c894dcfa4cMD51LICENSElicense.txtlicense.txttext/plain; charset=utf-81383https://repositorio.ufsc.br/bitstream/123456789/105488/2/license.txt11ee89cd31d893362820eab7c4d46734MD52TEXTTCC-Marina-Final_Com_Ficha.pdf.txtTCC-Marina-Final_Com_Ficha.pdf.txtExtracted texttext/plain185326https://repositorio.ufsc.br/bitstream/123456789/105488/3/TCC-Marina-Final_Com_Ficha.pdf.txt05e0b67a7bd380bf1431ac2fbcd3ff88MD53123456789/1054882014-01-19 00:27:14.17oai:repositorio.ufsc.br:123456789/105488Vm9jw6ogdGVtIGEgbGliZXJkYWRlIGRlOiBDb21wYXJ0aWxoYXIg4oCUIGNvcGlhciwgZGlzdHJpYnVpciBlIHRyYW5zbWl0aXIgYSBvYnJhLiBSZW1peGFyIOKAlCBjcmlhciBvYnJhcyBkZXJpdmFkYXMuClNvYiBhcyBzZWd1aW50ZXMgY29uZGnDp8O1ZXM6IEF0cmlidWnDp8OjbyDigJQgVm9jw6ogZGV2ZSBjcmVkaXRhciBhIG9icmEgZGEgZm9ybWEgZXNwZWNpZmljYWRhIHBlbG8gYXV0b3Igb3UgbGljZW5jaWFudGUgKG1hcyBuw6NvIGRlIG1hbmVpcmEgcXVlIHN1Z2lyYSBxdWUgZXN0ZXMgY29uY2VkZW0gcXVhbHF1ZXIgYXZhbCBhIHZvY8OqIG91IGFvIHNldSB1c28gZGEgb2JyYSkuIFVzbyBuw6NvLWNvbWVyY2lhbCDigJQgVm9jw6ogbsOjbyBwb2RlIHVzYXIgZXN0YSBvYnJhIHBhcmEgZmlucyBjb21lcmNpYWlzLgpGaWNhbmRvIGNsYXJvIHF1ZTogUmVuw7puY2lhIOKAlCBRdWFscXVlciBkYXMgY29uZGnDp8O1ZXMgYWNpbWEgcG9kZSBzZXIgcmVudW5jaWFkYSBzZSB2b2PDqiBvYnRpdmVyIHBlcm1pc3PDo28gZG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMuIERvbcOtbmlvIFDDumJsaWNvIOKAlCBPbmRlIGEgb2JyYSBvdSBxdWFscXVlciBkZSBzZXVzIGVsZW1lbnRvcyBlc3RpdmVyIGVtIGRvbcOtbmlvIHDDumJsaWNvIHNvYiBvIGRpcmVpdG8gYXBsaWPDoXZlbCwgZXN0YSBjb25kacOnw6NvIG7Do28gw6ksIGRlIG1hbmVpcmEgYWxndW1hLCBhZmV0YWRhIHBlbGEgbGljZW7Dp2EuIE91dHJvcyBEaXJlaXRvcyDigJQgT3Mgc2VndWludGVzIGRpcmVpdG9zIG7Do28gc8OjbywgZGUgbWFuZWlyYSBhbGd1bWEsIGFmZXRhZG9zIHBlbGEgbGljZW7Dp2E6IExpbWl0YcOnw7VlcyBlIGV4Y2XDp8O1ZXMgYW9zIGRpcmVpdG9zIGF1dG9yYWlzIG91IHF1YWlzcXVlciB1c29zIGxpdnJlcyBhcGxpY8OhdmVpczsgT3MgZGlyZWl0b3MgbW9yYWlzIGRvIGF1dG9yOyBEaXJlaXRvcyBxdWUgb3V0cmFzIHBlc3NvYXMgcG9kZW0gdGVyIHNvYnJlIGEgb2JyYSBvdSBzb2JyZSBhIHV0aWxpemHDp8OjbyBkYSBvYnJhLCB0YWlzIGNvbW8gZGlyZWl0b3MgZGUgaW1hZ2VtIG91IHByaXZhY2lkYWRlLiBBdmlzbyDigJQgUGFyYSBxdWFscXVlciByZXV0aWxpemHDp8OjbyBvdSBkaXN0cmlidWnDp8Ojbywgdm9jw6ogZGV2ZSBkZWl4YXIgY2xhcm8gYSB0ZXJjZWlyb3Mgb3MgdGVybW9zIGRhIGxpY2Vuw6dhIGEgcXVlIHNlIGVuY29udHJhIHN1Ym1ldGlkYSBlc3RhIG9icmEuIEEgbWVsaG9yIG1hbmVpcmEgZGUgZmF6ZXIgaXNzbyDDqSBjb20gdW0gbGluayBwYXJhIGVzdGEgcMOhZ2luYS4KTGljZW7Dp2EgQ3JlYXRpdmUgQ29tbW9ucyAtIGh0dHA6Ly9jcmVhdGl2ZWNvbW1vbnMub3JnL2xpY2Vuc2VzL2J5LW5jLzMuMC9ici8KRepositório de PublicaçõesPUBhttp://150.162.242.35/oai/requestopendoar:23732014-01-19T02:27:14Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)false
dc.title.en.fl_str_mv Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
title Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
spellingShingle Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
Sérgio, Marina Carradore
Descoberta do conhecimento
Bases textuais
Relacionamentos indiretos
Computação distribuída
title_short Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
title_full Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
title_fullStr Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
title_full_unstemmed Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
title_sort Uma arquitetura de descoberta de conhecimento baseada na correlação e associação temporal de padroões textuais
author Sérgio, Marina Carradore
author_facet Sérgio, Marina Carradore
author_role author
dc.contributor.en.fl_str_mv Universidade Federal de Santa Catarina. Campus Araranguá
dc.contributor.author.fl_str_mv Sérgio, Marina Carradore
dc.contributor.advisor1.fl_str_mv Gonçalves, Alexandre Leopoldo
contributor_str_mv Gonçalves, Alexandre Leopoldo
dc.subject.eng.fl_str_mv Descoberta do conhecimento
Bases textuais
Relacionamentos indiretos
Computação distribuída
topic Descoberta do conhecimento
Bases textuais
Relacionamentos indiretos
Computação distribuída
description TCC (graduação) - Universidade Federal de Santa Catarina, Campus Araranguá, Curso de Tecnologias da Informação e Comunicação.
publishDate 2013
dc.date.submitted.none.fl_str_mv 2013-07-20
dc.date.accessioned.fl_str_mv 2013-10-30T17:38:39Z
dc.date.available.fl_str_mv 2013-10-30T17:38:39Z
dc.date.issued.fl_str_mv 2013-07-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufsc.br/handle/123456789/105488
url https://repositorio.ufsc.br/handle/123456789/105488
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv 125p.
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFSC
instname:Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
instname_str Universidade Federal de Santa Catarina (UFSC)
instacron_str UFSC
institution UFSC
reponame_str Repositório Institucional da UFSC
collection Repositório Institucional da UFSC
bitstream.url.fl_str_mv https://repositorio.ufsc.br/bitstream/123456789/105488/1/TCC-Marina-Final_Com_Ficha.pdf
https://repositorio.ufsc.br/bitstream/123456789/105488/2/license.txt
https://repositorio.ufsc.br/bitstream/123456789/105488/3/TCC-Marina-Final_Com_Ficha.pdf.txt
bitstream.checksum.fl_str_mv 376619498bcbb876ea5da9c894dcfa4c
11ee89cd31d893362820eab7c4d46734
05e0b67a7bd380bf1431ac2fbcd3ff88
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFSC - Universidade Federal de Santa Catarina (UFSC)
repository.mail.fl_str_mv
_version_ 1766805235472269312