Uso de text mining na determinação da relação entre instituições de investigação e empresas

Detalhes bibliográficos
Autor(a) principal: Silva, Sérgio Ricardo Magalhães Marques da
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10400.22/22647
Resumo: A excelência da investigação científica produzida é indissociável da inovação e criação de valor económico e social. Assim, a aproximação entre diferentes áreas científicas e de negócio, e a consolidação de formas de colaboração entre as instituições de investigação e o tecido económico e social, potencia a criação, transferência e valorização do conhecimento. Neste processo têm particular importância as unidades de investigação e as empresas, com papeis diferenciados, mas essenciais para completar o ciclo de inovação. No mundo competitivo de hoje, a capacidade de extrair conhecimento útil de dados e tomar decisões de acordo com esse conhecimento é cada vez mais importante e essencial. O processo de aplicação de metodologias para extração de conhecimento a partir de dados textuais é denominado de text mining. A sua utilização tem como benefício a grande quantidade de informação importante latente neste formato e que não está disponível nos formatos clássicos de dados estruturados. Neste trabalho foi desenvolvida uma ferramenta de apoio estratégico, que tem como objetivo potenciar a colaboração entre unidades de investigação e o tecido empresarial. Através de metodologias de text mining, nomeadamente sumário da informação e topic modeling com utilização do modelo Latent Dirichlet Allocation, é analisada a informação disponível nos websites das unidades de investigação e das empresas e são identificadas possíveis relações. É a primeira vez que é analisado este tipo de informação com recurso a metodologias de text mining e com o propósito de potenciar a relação entre estas estruturas. A análise de resultados obtidos permitiu concluir que os mesmos estão dependentes da qualidade da informação disponível nos websites e da representatividade de todas as áreas. Caso estas condições sejam garantidas, esperam-se bons resultados relativos a possíveis relações, tendo sempre em consideração que estes resultados poderão não ser os mais óbvios tendo por base o conhecimento prévio das entidades em análise. Assim, a ferramenta deverá ser utilizada como apoio na tomada de decisão, devendo os resultados obtidos ser analisados de forma crítica e em complemento à experiência de especialistas.
id RCAP_cad45bedc1047501453eae220736d842
oai_identifier_str oai:recipp.ipp.pt:10400.22/22647
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Uso de text mining na determinação da relação entre instituições de investigação e empresasTransferência e valorização do conhecimentoUnidades de investigaçãoEmpresasText miningTopic modelingFerramenta webKnowledge transfer and valorizationResearch unitsCompaniesWeb toolA excelência da investigação científica produzida é indissociável da inovação e criação de valor económico e social. Assim, a aproximação entre diferentes áreas científicas e de negócio, e a consolidação de formas de colaboração entre as instituições de investigação e o tecido económico e social, potencia a criação, transferência e valorização do conhecimento. Neste processo têm particular importância as unidades de investigação e as empresas, com papeis diferenciados, mas essenciais para completar o ciclo de inovação. No mundo competitivo de hoje, a capacidade de extrair conhecimento útil de dados e tomar decisões de acordo com esse conhecimento é cada vez mais importante e essencial. O processo de aplicação de metodologias para extração de conhecimento a partir de dados textuais é denominado de text mining. A sua utilização tem como benefício a grande quantidade de informação importante latente neste formato e que não está disponível nos formatos clássicos de dados estruturados. Neste trabalho foi desenvolvida uma ferramenta de apoio estratégico, que tem como objetivo potenciar a colaboração entre unidades de investigação e o tecido empresarial. Através de metodologias de text mining, nomeadamente sumário da informação e topic modeling com utilização do modelo Latent Dirichlet Allocation, é analisada a informação disponível nos websites das unidades de investigação e das empresas e são identificadas possíveis relações. É a primeira vez que é analisado este tipo de informação com recurso a metodologias de text mining e com o propósito de potenciar a relação entre estas estruturas. A análise de resultados obtidos permitiu concluir que os mesmos estão dependentes da qualidade da informação disponível nos websites e da representatividade de todas as áreas. Caso estas condições sejam garantidas, esperam-se bons resultados relativos a possíveis relações, tendo sempre em consideração que estes resultados poderão não ser os mais óbvios tendo por base o conhecimento prévio das entidades em análise. Assim, a ferramenta deverá ser utilizada como apoio na tomada de decisão, devendo os resultados obtidos ser analisados de forma crítica e em complemento à experiência de especialistas.The excellence of the scientific research produced is inseparable from innovation and the creation of economic and social value. Thus, the approximation between different scientific and business areas and the consolidation of forms of collaboration between research institutions and the economic and social fabric, boosts the creation, transfer and valorization of knowledge. In this process, research units and companies are particularly important, with different but essential roles to complete the innovation cycle. In today’s competitive world, the ability to extract useful knowledge from data and make decisions according to that knowledge is increasingly important and essential. The process of applying methodologies to extract knowledge from textual data is called text mining. Its use has the benefit of accessing to a large amount of important information latent in this format and which is not available in the classic structured data formats. In this work a strategic support tool was developed, aiming to enhance collaboration between research units and the business fabric. Through the use of text mining methodologies, namely information summary and topic modeling using the Latent Dirichlet Allocation model, the information available on the websites of research units and companies is analyzed and possible connections are identified. It is the first time that this type of information is analyzed using text mining methodologies and with the purpose of enhancing the relationship between these structures. The analysis of results led to the conclusion that these results depend on the quality of the information available on the websites and the representativeness of all areas. If these conditions are guaranteed, good results are expected regarding possible connections, always bearing in mind that these results may not be the most obvious, based on the prior knowledge of the entities under analysis. Therefore, the tool should be used as a support in decision making and the results obtained should be critically analyzed in addition to the experience of experts.Azevedo, Filipe Miguel Tavares deRepositório Científico do Instituto Politécnico do PortoSilva, Sérgio Ricardo Magalhães Marques da2023-03-31T11:03:31Z20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/22647TID:203114000porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-04-05T01:46:27Zoai:recipp.ipp.pt:10400.22/22647Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:48:28.337852Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Uso de text mining na determinação da relação entre instituições de investigação e empresas
title Uso de text mining na determinação da relação entre instituições de investigação e empresas
spellingShingle Uso de text mining na determinação da relação entre instituições de investigação e empresas
Silva, Sérgio Ricardo Magalhães Marques da
Transferência e valorização do conhecimento
Unidades de investigação
Empresas
Text mining
Topic modeling
Ferramenta web
Knowledge transfer and valorization
Research units
Companies
Web tool
title_short Uso de text mining na determinação da relação entre instituições de investigação e empresas
title_full Uso de text mining na determinação da relação entre instituições de investigação e empresas
title_fullStr Uso de text mining na determinação da relação entre instituições de investigação e empresas
title_full_unstemmed Uso de text mining na determinação da relação entre instituições de investigação e empresas
title_sort Uso de text mining na determinação da relação entre instituições de investigação e empresas
author Silva, Sérgio Ricardo Magalhães Marques da
author_facet Silva, Sérgio Ricardo Magalhães Marques da
author_role author
dc.contributor.none.fl_str_mv Azevedo, Filipe Miguel Tavares de
Repositório Científico do Instituto Politécnico do Porto
dc.contributor.author.fl_str_mv Silva, Sérgio Ricardo Magalhães Marques da
dc.subject.por.fl_str_mv Transferência e valorização do conhecimento
Unidades de investigação
Empresas
Text mining
Topic modeling
Ferramenta web
Knowledge transfer and valorization
Research units
Companies
Web tool
topic Transferência e valorização do conhecimento
Unidades de investigação
Empresas
Text mining
Topic modeling
Ferramenta web
Knowledge transfer and valorization
Research units
Companies
Web tool
description A excelência da investigação científica produzida é indissociável da inovação e criação de valor económico e social. Assim, a aproximação entre diferentes áreas científicas e de negócio, e a consolidação de formas de colaboração entre as instituições de investigação e o tecido económico e social, potencia a criação, transferência e valorização do conhecimento. Neste processo têm particular importância as unidades de investigação e as empresas, com papeis diferenciados, mas essenciais para completar o ciclo de inovação. No mundo competitivo de hoje, a capacidade de extrair conhecimento útil de dados e tomar decisões de acordo com esse conhecimento é cada vez mais importante e essencial. O processo de aplicação de metodologias para extração de conhecimento a partir de dados textuais é denominado de text mining. A sua utilização tem como benefício a grande quantidade de informação importante latente neste formato e que não está disponível nos formatos clássicos de dados estruturados. Neste trabalho foi desenvolvida uma ferramenta de apoio estratégico, que tem como objetivo potenciar a colaboração entre unidades de investigação e o tecido empresarial. Através de metodologias de text mining, nomeadamente sumário da informação e topic modeling com utilização do modelo Latent Dirichlet Allocation, é analisada a informação disponível nos websites das unidades de investigação e das empresas e são identificadas possíveis relações. É a primeira vez que é analisado este tipo de informação com recurso a metodologias de text mining e com o propósito de potenciar a relação entre estas estruturas. A análise de resultados obtidos permitiu concluir que os mesmos estão dependentes da qualidade da informação disponível nos websites e da representatividade de todas as áreas. Caso estas condições sejam garantidas, esperam-se bons resultados relativos a possíveis relações, tendo sempre em consideração que estes resultados poderão não ser os mais óbvios tendo por base o conhecimento prévio das entidades em análise. Assim, a ferramenta deverá ser utilizada como apoio na tomada de decisão, devendo os resultados obtidos ser analisados de forma crítica e em complemento à experiência de especialistas.
publishDate 2022
dc.date.none.fl_str_mv 2022
2022-01-01T00:00:00Z
2023-03-31T11:03:31Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/22647
TID:203114000
url http://hdl.handle.net/10400.22/22647
identifier_str_mv TID:203114000
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799131567763750912