Caracterização de grupos baseada em informações relacionais
Autor(a) principal: | |
---|---|
Data de Publicação: | 2018 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Repositório Institucional da UFPE |
Texto Completo: | https://repositorio.ufpe.br/handle/123456789/33641 |
Resumo: | Com o crescimento das redes sociais, diversas pesquisas vêm sendo realizadas para entendimento de suas estruturas. A análise e a extração de conhecimento das redes são largamente empregadas, dentre as investigações a compreensão do comportamento e das tendências das comunidades é uma atividade estratégica. Grande parte desse esforço está direcionado à detecção dos agrupamentos implícitos nas redes, detecção de comunidades; entretanto igualmente relevante é a atividade de rotulagem dos grupos, denominada caracterização de comunidades. Essa visa à descrição das comunidades a partir dos atributos individuais dos usuários. Entre as principais características dos métodos atuais de caracterização grupos, temos: (1) caracterização baseada apenas nos atributos dos usuários, (2) níveis de relevâncias equivalentes a todos os usuários e (3) consideração de todos os usuários da comunidade na caracterização. Todavia, em ambientes nos quais haja conexões entre seus usuários, como as redes sociais, uma nova dimensão de informação se apresenta, através da análise dos relacionamentos e afinidades entre os usuários (informação relacional). Presumivelmente, todas as comunidades têm os seus usuários influentes. Esses são os líderes de opinião, e podem desempenhar um papel mais importante para refletir as peculiaridades de uma comunidade. Tratar a escalabilidade das redes tende a ser um dos principais desafios das abordagens de caracterização de grupos, pois essa propriedade reflete diretamente na complexidade de descrição e robustez. Buscando o desenvolvimento de uma abordagem escalável e a incorporação dos benefícios supracitados com o uso das informações relacionais, propomos uma abordagem para caracterização de comunidades sociais baseada em informações relacionais. Assim, foi proposta a adição de uma nova etapa ao processo de caracterização de grupos, essa é responsável por filtrar os principais nós das comunidades a partir das informações relacionais (centralidade), ou seja, selecionar os nós que serão considerados no processo de caracterização dos grupos. O propósito é selecionar os nós, que representem/generalizem as comunidades, produzindo os melhores perfis possíveis, sem perdas de informações relevantes. Definiu-se como estudo de caso para esta tese as redes de coautoria, mais precisamente utilizou-se a biblioteca arXiv. Descrever comunidades acadêmicas é algo fundamental, proporcionando entendimento e acompanhamento das pesquisas, bem como a verificação das mudanças de temas nas comunidades. Os resultados, obtidos em três experimentos, demonstraram a capacidade da abordagem proposta na produção de perfis descritivos para os grupos observados, tanto fazendo uso de métodos de caracterização de grupos como de rotulagem de agrupamentos em documentos, com um custo computacional consideravelmente menor. |
id |
UFPE_d85fb5c45c8537aa14a66ddac249a57f |
---|---|
oai_identifier_str |
oai:repositorio.ufpe.br:123456789/33641 |
network_acronym_str |
UFPE |
network_name_str |
Repositório Institucional da UFPE |
repository_id_str |
2221 |
spelling |
GOMES, João Emanoel Ambrósiohttp://lattes.cnpq.br/4494150663121260http://lattes.cnpq.br/2984888073123287PRUDÊNCIO, Ricardo Bastos Cavalcante2019-09-25T20:15:14Z2019-09-25T20:15:14Z2018-12-13https://repositorio.ufpe.br/handle/123456789/33641Com o crescimento das redes sociais, diversas pesquisas vêm sendo realizadas para entendimento de suas estruturas. A análise e a extração de conhecimento das redes são largamente empregadas, dentre as investigações a compreensão do comportamento e das tendências das comunidades é uma atividade estratégica. Grande parte desse esforço está direcionado à detecção dos agrupamentos implícitos nas redes, detecção de comunidades; entretanto igualmente relevante é a atividade de rotulagem dos grupos, denominada caracterização de comunidades. Essa visa à descrição das comunidades a partir dos atributos individuais dos usuários. Entre as principais características dos métodos atuais de caracterização grupos, temos: (1) caracterização baseada apenas nos atributos dos usuários, (2) níveis de relevâncias equivalentes a todos os usuários e (3) consideração de todos os usuários da comunidade na caracterização. Todavia, em ambientes nos quais haja conexões entre seus usuários, como as redes sociais, uma nova dimensão de informação se apresenta, através da análise dos relacionamentos e afinidades entre os usuários (informação relacional). Presumivelmente, todas as comunidades têm os seus usuários influentes. Esses são os líderes de opinião, e podem desempenhar um papel mais importante para refletir as peculiaridades de uma comunidade. Tratar a escalabilidade das redes tende a ser um dos principais desafios das abordagens de caracterização de grupos, pois essa propriedade reflete diretamente na complexidade de descrição e robustez. Buscando o desenvolvimento de uma abordagem escalável e a incorporação dos benefícios supracitados com o uso das informações relacionais, propomos uma abordagem para caracterização de comunidades sociais baseada em informações relacionais. Assim, foi proposta a adição de uma nova etapa ao processo de caracterização de grupos, essa é responsável por filtrar os principais nós das comunidades a partir das informações relacionais (centralidade), ou seja, selecionar os nós que serão considerados no processo de caracterização dos grupos. O propósito é selecionar os nós, que representem/generalizem as comunidades, produzindo os melhores perfis possíveis, sem perdas de informações relevantes. Definiu-se como estudo de caso para esta tese as redes de coautoria, mais precisamente utilizou-se a biblioteca arXiv. Descrever comunidades acadêmicas é algo fundamental, proporcionando entendimento e acompanhamento das pesquisas, bem como a verificação das mudanças de temas nas comunidades. Os resultados, obtidos em três experimentos, demonstraram a capacidade da abordagem proposta na produção de perfis descritivos para os grupos observados, tanto fazendo uso de métodos de caracterização de grupos como de rotulagem de agrupamentos em documentos, com um custo computacional consideravelmente menor.CNPqWith the growth of social networks, several types of research have been carried out to understand their structures. Knowledge analysis and extraction of networks are widely used, among investigations understanding the behavior and trends of communities is a strategic activity. Much of this effort is directed to the detection of implicit groupings in networks, community detection; however, equally relevant is the communities labeling task, called group profiling. It aims at describing communities from the individual attributes of users. Among the main characteristics of the current group profiling methods, we have (1) characterization based only on the attributes of the users, (2) levels of relevancy equivalent to all users and (3) consideration of all users of the community in the characterization. However, in environments where there are connections between users, such as social networks, a new dimension of information is presented, through the analysis of relationships and affinities between users (relational information). Presumably, all communities have their influential users. These are opinion leaders, and they can play a more important role in reflecting the peculiarities of a community. Treating network scalability tends to be one of the main challenges of group profiling approaches, as this property directly reflects the complexity of description and robustness. Looking for the development of a scalable approach and incorporating the benefits mentioned above with the use of relational information, we propose an approach for group profiling based on the relational information. Thus, it was proposed to add a new stage to the group profiling process, which is responsible for filtering the main nodes of the communities from the relational information (centrality), that is, to select the nodes that will be considered in the group profiling process. The purpose is to select the nodes, which represent/generalize the communities, producing the best possible profiles, without loss of relevant information. The co-authoring networks were defined as a case study for this thesis, more precisely the arXiv library was used. Describing academic communities is fundamental, providing understanding and monitoring of research, as well as verifying the changes of themes in the communities. The results, obtained in three experiments, demonstrated the ability of the proposed approach to producing descriptive profiles for the observed groups, using group profiling methods and cluster labeling, with a considerably lower computational cost.porUniversidade Federal de PernambucoPrograma de Pos Graduacao em Ciencia da ComputacaoUFPEBrasilAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessInteligência artificialInformações relacionaisCaracterização de grupos baseada em informações relacionaisinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisdoutoradoreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPETHUMBNAILTESE João Emanoel Ambrósio Gomes.pdf.jpgTESE João Emanoel Ambrósio Gomes.pdf.jpgGenerated Thumbnailimage/jpeg1218https://repositorio.ufpe.br/bitstream/123456789/33641/5/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.jpg9f3651364cd1fdc7bb06a1817b6feeb6MD55ORIGINALTESE João Emanoel Ambrósio Gomes.pdfTESE João Emanoel Ambrósio Gomes.pdfapplication/pdf3590018https://repositorio.ufpe.br/bitstream/123456789/33641/1/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdfe35b07674c2622109783754f81732e3fMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufpe.br/bitstream/123456789/33641/2/license_rdfe39d27027a6cc9cb039ad269a5db8e34MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82310https://repositorio.ufpe.br/bitstream/123456789/33641/3/license.txtbd573a5ca8288eb7272482765f819534MD53TEXTTESE João Emanoel Ambrósio Gomes.pdf.txtTESE João Emanoel Ambrósio Gomes.pdf.txtExtracted texttext/plain308927https://repositorio.ufpe.br/bitstream/123456789/33641/4/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.txt20a8fa33502d77e1dd3fece47df16316MD54123456789/336412019-10-25 06:51:00.529oai:repositorio.ufpe.br:123456789/33641TGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKClRvZG8gZGVwb3NpdGFudGUgZGUgbWF0ZXJpYWwgbm8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgKFJJKSBkZXZlIGNvbmNlZGVyLCDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBQZXJuYW1idWNvIChVRlBFKSwgdW1hIExpY2Vuw6dhIGRlIERpc3RyaWJ1acOnw6NvIE7Do28gRXhjbHVzaXZhIHBhcmEgbWFudGVyIGUgdG9ybmFyIGFjZXNzw612ZWlzIG9zIHNldXMgZG9jdW1lbnRvcywgZW0gZm9ybWF0byBkaWdpdGFsLCBuZXN0ZSByZXBvc2l0w7NyaW8uCgpDb20gYSBjb25jZXNzw6NvIGRlc3RhIGxpY2Vuw6dhIG7Do28gZXhjbHVzaXZhLCBvIGRlcG9zaXRhbnRlIG1hbnTDqW0gdG9kb3Mgb3MgZGlyZWl0b3MgZGUgYXV0b3IuCl9fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fX19fXwoKTGljZW7Dp2EgZGUgRGlzdHJpYnVpw6fDo28gTsOjbyBFeGNsdXNpdmEKCkFvIGNvbmNvcmRhciBjb20gZXN0YSBsaWNlbsOnYSBlIGFjZWl0w6EtbGEsIHZvY8OqIChhdXRvciBvdSBkZXRlbnRvciBkb3MgZGlyZWl0b3MgYXV0b3JhaXMpOgoKYSkgRGVjbGFyYSBxdWUgY29uaGVjZSBhIHBvbMOtdGljYSBkZSBjb3B5cmlnaHQgZGEgZWRpdG9yYSBkbyBzZXUgZG9jdW1lbnRvOwpiKSBEZWNsYXJhIHF1ZSBjb25oZWNlIGUgYWNlaXRhIGFzIERpcmV0cml6ZXMgcGFyYSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEU7CmMpIENvbmNlZGUgw6AgVUZQRSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZGUgYXJxdWl2YXIsIHJlcHJvZHV6aXIsIGNvbnZlcnRlciAoY29tbyBkZWZpbmlkbyBhIHNlZ3VpciksIGNvbXVuaWNhciBlL291IGRpc3RyaWJ1aXIsIG5vIFJJLCBvIGRvY3VtZW50byBlbnRyZWd1ZSAoaW5jbHVpbmRvIG8gcmVzdW1vL2Fic3RyYWN0KSBlbSBmb3JtYXRvIGRpZ2l0YWwgb3UgcG9yIG91dHJvIG1laW87CmQpIERlY2xhcmEgcXVlIGF1dG9yaXphIGEgVUZQRSBhIGFycXVpdmFyIG1haXMgZGUgdW1hIGPDs3BpYSBkZXN0ZSBkb2N1bWVudG8gZSBjb252ZXJ0w6otbG8sIHNlbSBhbHRlcmFyIG8gc2V1IGNvbnRlw7pkbywgcGFyYSBxdWFscXVlciBmb3JtYXRvIGRlIGZpY2hlaXJvLCBtZWlvIG91IHN1cG9ydGUsIHBhcmEgZWZlaXRvcyBkZSBzZWd1cmFuw6dhLCBwcmVzZXJ2YcOnw6NvIChiYWNrdXApIGUgYWNlc3NvOwplKSBEZWNsYXJhIHF1ZSBvIGRvY3VtZW50byBzdWJtZXRpZG8gw6kgbyBzZXUgdHJhYmFsaG8gb3JpZ2luYWwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBhIHRlcmNlaXJvcyBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2Ugb3MgZGlyZWl0b3MgZGUgb3V0cmEgcGVzc29hIG91IGVudGlkYWRlOwpmKSBEZWNsYXJhIHF1ZSwgbm8gY2FzbyBkbyBkb2N1bWVudG8gc3VibWV0aWRvIGNvbnRlciBtYXRlcmlhbCBkbyBxdWFsIG7Do28gZGV0w6ltIG9zIGRpcmVpdG9zIGRlCmF1dG9yLCBvYnRldmUgYSBhdXRvcml6YcOnw6NvIGlycmVzdHJpdGEgZG8gcmVzcGVjdGl2byBkZXRlbnRvciBkZXNzZXMgZGlyZWl0b3MgcGFyYSBjZWRlciDDoApVRlBFIG9zIGRpcmVpdG9zIHJlcXVlcmlkb3MgcG9yIGVzdGEgTGljZW7Dp2EgZSBhdXRvcml6YXIgYSB1bml2ZXJzaWRhZGUgYSB1dGlsaXrDoS1sb3MgbGVnYWxtZW50ZS4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBlc3NlIG1hdGVyaWFsIGN1am9zIGRpcmVpdG9zIHPDo28gZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3UgY29udGXDumRvIGRvIGRvY3VtZW50byBlbnRyZWd1ZTsKZykgU2UgbyBkb2N1bWVudG8gZW50cmVndWUgw6kgYmFzZWFkbyBlbSB0cmFiYWxobyBmaW5hbmNpYWRvIG91IGFwb2lhZG8gcG9yIG91dHJhIGluc3RpdHVpw6fDo28gcXVlIG7Do28gYSBVRlBFLCBkZWNsYXJhIHF1ZSBjdW1wcml1IHF1YWlzcXVlciBvYnJpZ2HDp8O1ZXMgZXhpZ2lkYXMgcGVsbyByZXNwZWN0aXZvIGNvbnRyYXRvIG91IGFjb3Jkby4KCkEgVUZQRSBpZGVudGlmaWNhcsOhIGNsYXJhbWVudGUgbyhzKSBub21lKHMpIGRvKHMpIGF1dG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50byBlbnRyZWd1ZSBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIHBhcmEgYWzDqW0gZG8gcHJldmlzdG8gbmEgYWzDrW5lYSBjKS4KRepositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212019-10-25T09:51Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false |
dc.title.pt_BR.fl_str_mv |
Caracterização de grupos baseada em informações relacionais |
title |
Caracterização de grupos baseada em informações relacionais |
spellingShingle |
Caracterização de grupos baseada em informações relacionais GOMES, João Emanoel Ambrósio Inteligência artificial Informações relacionais |
title_short |
Caracterização de grupos baseada em informações relacionais |
title_full |
Caracterização de grupos baseada em informações relacionais |
title_fullStr |
Caracterização de grupos baseada em informações relacionais |
title_full_unstemmed |
Caracterização de grupos baseada em informações relacionais |
title_sort |
Caracterização de grupos baseada em informações relacionais |
author |
GOMES, João Emanoel Ambrósio |
author_facet |
GOMES, João Emanoel Ambrósio |
author_role |
author |
dc.contributor.authorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/4494150663121260 |
dc.contributor.advisorLattes.pt_BR.fl_str_mv |
http://lattes.cnpq.br/2984888073123287 |
dc.contributor.author.fl_str_mv |
GOMES, João Emanoel Ambrósio |
dc.contributor.advisor1.fl_str_mv |
PRUDÊNCIO, Ricardo Bastos Cavalcante |
contributor_str_mv |
PRUDÊNCIO, Ricardo Bastos Cavalcante |
dc.subject.por.fl_str_mv |
Inteligência artificial Informações relacionais |
topic |
Inteligência artificial Informações relacionais |
description |
Com o crescimento das redes sociais, diversas pesquisas vêm sendo realizadas para entendimento de suas estruturas. A análise e a extração de conhecimento das redes são largamente empregadas, dentre as investigações a compreensão do comportamento e das tendências das comunidades é uma atividade estratégica. Grande parte desse esforço está direcionado à detecção dos agrupamentos implícitos nas redes, detecção de comunidades; entretanto igualmente relevante é a atividade de rotulagem dos grupos, denominada caracterização de comunidades. Essa visa à descrição das comunidades a partir dos atributos individuais dos usuários. Entre as principais características dos métodos atuais de caracterização grupos, temos: (1) caracterização baseada apenas nos atributos dos usuários, (2) níveis de relevâncias equivalentes a todos os usuários e (3) consideração de todos os usuários da comunidade na caracterização. Todavia, em ambientes nos quais haja conexões entre seus usuários, como as redes sociais, uma nova dimensão de informação se apresenta, através da análise dos relacionamentos e afinidades entre os usuários (informação relacional). Presumivelmente, todas as comunidades têm os seus usuários influentes. Esses são os líderes de opinião, e podem desempenhar um papel mais importante para refletir as peculiaridades de uma comunidade. Tratar a escalabilidade das redes tende a ser um dos principais desafios das abordagens de caracterização de grupos, pois essa propriedade reflete diretamente na complexidade de descrição e robustez. Buscando o desenvolvimento de uma abordagem escalável e a incorporação dos benefícios supracitados com o uso das informações relacionais, propomos uma abordagem para caracterização de comunidades sociais baseada em informações relacionais. Assim, foi proposta a adição de uma nova etapa ao processo de caracterização de grupos, essa é responsável por filtrar os principais nós das comunidades a partir das informações relacionais (centralidade), ou seja, selecionar os nós que serão considerados no processo de caracterização dos grupos. O propósito é selecionar os nós, que representem/generalizem as comunidades, produzindo os melhores perfis possíveis, sem perdas de informações relevantes. Definiu-se como estudo de caso para esta tese as redes de coautoria, mais precisamente utilizou-se a biblioteca arXiv. Descrever comunidades acadêmicas é algo fundamental, proporcionando entendimento e acompanhamento das pesquisas, bem como a verificação das mudanças de temas nas comunidades. Os resultados, obtidos em três experimentos, demonstraram a capacidade da abordagem proposta na produção de perfis descritivos para os grupos observados, tanto fazendo uso de métodos de caracterização de grupos como de rotulagem de agrupamentos em documentos, com um custo computacional consideravelmente menor. |
publishDate |
2018 |
dc.date.issued.fl_str_mv |
2018-12-13 |
dc.date.accessioned.fl_str_mv |
2019-09-25T20:15:14Z |
dc.date.available.fl_str_mv |
2019-09-25T20:15:14Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://repositorio.ufpe.br/handle/123456789/33641 |
url |
https://repositorio.ufpe.br/handle/123456789/33641 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ |
eu_rights_str_mv |
openAccess |
dc.publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.publisher.program.fl_str_mv |
Programa de Pos Graduacao em Ciencia da Computacao |
dc.publisher.initials.fl_str_mv |
UFPE |
dc.publisher.country.fl_str_mv |
Brasil |
publisher.none.fl_str_mv |
Universidade Federal de Pernambuco |
dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco (UFPE) instacron:UFPE |
instname_str |
Universidade Federal de Pernambuco (UFPE) |
instacron_str |
UFPE |
institution |
UFPE |
reponame_str |
Repositório Institucional da UFPE |
collection |
Repositório Institucional da UFPE |
bitstream.url.fl_str_mv |
https://repositorio.ufpe.br/bitstream/123456789/33641/5/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.jpg https://repositorio.ufpe.br/bitstream/123456789/33641/1/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf https://repositorio.ufpe.br/bitstream/123456789/33641/2/license_rdf https://repositorio.ufpe.br/bitstream/123456789/33641/3/license.txt https://repositorio.ufpe.br/bitstream/123456789/33641/4/TESE%20Jo%c3%a3o%20Emanoel%20Ambr%c3%b3sio%20Gomes.pdf.txt |
bitstream.checksum.fl_str_mv |
9f3651364cd1fdc7bb06a1817b6feeb6 e35b07674c2622109783754f81732e3f e39d27027a6cc9cb039ad269a5db8e34 bd573a5ca8288eb7272482765f819534 20a8fa33502d77e1dd3fece47df16316 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE) |
repository.mail.fl_str_mv |
attena@ufpe.br |
_version_ |
1802310621962698752 |