Uso de text mining na determinação da relação entre instituições de investigação e empresas
Autor(a) principal: | |
---|---|
Data de Publicação: | 2022 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10400.22/22647 |
Resumo: | A excelência da investigação científica produzida é indissociável da inovação e criação de valor económico e social. Assim, a aproximação entre diferentes áreas científicas e de negócio, e a consolidação de formas de colaboração entre as instituições de investigação e o tecido económico e social, potencia a criação, transferência e valorização do conhecimento. Neste processo têm particular importância as unidades de investigação e as empresas, com papeis diferenciados, mas essenciais para completar o ciclo de inovação. No mundo competitivo de hoje, a capacidade de extrair conhecimento útil de dados e tomar decisões de acordo com esse conhecimento é cada vez mais importante e essencial. O processo de aplicação de metodologias para extração de conhecimento a partir de dados textuais é denominado de text mining. A sua utilização tem como benefício a grande quantidade de informação importante latente neste formato e que não está disponível nos formatos clássicos de dados estruturados. Neste trabalho foi desenvolvida uma ferramenta de apoio estratégico, que tem como objetivo potenciar a colaboração entre unidades de investigação e o tecido empresarial. Através de metodologias de text mining, nomeadamente sumário da informação e topic modeling com utilização do modelo Latent Dirichlet Allocation, é analisada a informação disponível nos websites das unidades de investigação e das empresas e são identificadas possíveis relações. É a primeira vez que é analisado este tipo de informação com recurso a metodologias de text mining e com o propósito de potenciar a relação entre estas estruturas. A análise de resultados obtidos permitiu concluir que os mesmos estão dependentes da qualidade da informação disponível nos websites e da representatividade de todas as áreas. Caso estas condições sejam garantidas, esperam-se bons resultados relativos a possíveis relações, tendo sempre em consideração que estes resultados poderão não ser os mais óbvios tendo por base o conhecimento prévio das entidades em análise. Assim, a ferramenta deverá ser utilizada como apoio na tomada de decisão, devendo os resultados obtidos ser analisados de forma crítica e em complemento à experiência de especialistas. |
id |
RCAP_cad45bedc1047501453eae220736d842 |
---|---|
oai_identifier_str |
oai:recipp.ipp.pt:10400.22/22647 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Uso de text mining na determinação da relação entre instituições de investigação e empresasTransferência e valorização do conhecimentoUnidades de investigaçãoEmpresasText miningTopic modelingFerramenta webKnowledge transfer and valorizationResearch unitsCompaniesWeb toolA excelência da investigação científica produzida é indissociável da inovação e criação de valor económico e social. Assim, a aproximação entre diferentes áreas científicas e de negócio, e a consolidação de formas de colaboração entre as instituições de investigação e o tecido económico e social, potencia a criação, transferência e valorização do conhecimento. Neste processo têm particular importância as unidades de investigação e as empresas, com papeis diferenciados, mas essenciais para completar o ciclo de inovação. No mundo competitivo de hoje, a capacidade de extrair conhecimento útil de dados e tomar decisões de acordo com esse conhecimento é cada vez mais importante e essencial. O processo de aplicação de metodologias para extração de conhecimento a partir de dados textuais é denominado de text mining. A sua utilização tem como benefício a grande quantidade de informação importante latente neste formato e que não está disponível nos formatos clássicos de dados estruturados. Neste trabalho foi desenvolvida uma ferramenta de apoio estratégico, que tem como objetivo potenciar a colaboração entre unidades de investigação e o tecido empresarial. Através de metodologias de text mining, nomeadamente sumário da informação e topic modeling com utilização do modelo Latent Dirichlet Allocation, é analisada a informação disponível nos websites das unidades de investigação e das empresas e são identificadas possíveis relações. É a primeira vez que é analisado este tipo de informação com recurso a metodologias de text mining e com o propósito de potenciar a relação entre estas estruturas. A análise de resultados obtidos permitiu concluir que os mesmos estão dependentes da qualidade da informação disponível nos websites e da representatividade de todas as áreas. Caso estas condições sejam garantidas, esperam-se bons resultados relativos a possíveis relações, tendo sempre em consideração que estes resultados poderão não ser os mais óbvios tendo por base o conhecimento prévio das entidades em análise. Assim, a ferramenta deverá ser utilizada como apoio na tomada de decisão, devendo os resultados obtidos ser analisados de forma crítica e em complemento à experiência de especialistas.The excellence of the scientific research produced is inseparable from innovation and the creation of economic and social value. Thus, the approximation between different scientific and business areas and the consolidation of forms of collaboration between research institutions and the economic and social fabric, boosts the creation, transfer and valorization of knowledge. In this process, research units and companies are particularly important, with different but essential roles to complete the innovation cycle. In today’s competitive world, the ability to extract useful knowledge from data and make decisions according to that knowledge is increasingly important and essential. The process of applying methodologies to extract knowledge from textual data is called text mining. Its use has the benefit of accessing to a large amount of important information latent in this format and which is not available in the classic structured data formats. In this work a strategic support tool was developed, aiming to enhance collaboration between research units and the business fabric. Through the use of text mining methodologies, namely information summary and topic modeling using the Latent Dirichlet Allocation model, the information available on the websites of research units and companies is analyzed and possible connections are identified. It is the first time that this type of information is analyzed using text mining methodologies and with the purpose of enhancing the relationship between these structures. The analysis of results led to the conclusion that these results depend on the quality of the information available on the websites and the representativeness of all areas. If these conditions are guaranteed, good results are expected regarding possible connections, always bearing in mind that these results may not be the most obvious, based on the prior knowledge of the entities under analysis. Therefore, the tool should be used as a support in decision making and the results obtained should be critically analyzed in addition to the experience of experts.Azevedo, Filipe Miguel Tavares deRepositório Científico do Instituto Politécnico do PortoSilva, Sérgio Ricardo Magalhães Marques da2023-03-31T11:03:31Z20222022-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/22647TID:203114000porinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2023-04-05T01:46:27Zoai:recipp.ipp.pt:10400.22/22647Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-19T17:48:28.337852Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Uso de text mining na determinação da relação entre instituições de investigação e empresas |
title |
Uso de text mining na determinação da relação entre instituições de investigação e empresas |
spellingShingle |
Uso de text mining na determinação da relação entre instituições de investigação e empresas Silva, Sérgio Ricardo Magalhães Marques da Transferência e valorização do conhecimento Unidades de investigação Empresas Text mining Topic modeling Ferramenta web Knowledge transfer and valorization Research units Companies Web tool |
title_short |
Uso de text mining na determinação da relação entre instituições de investigação e empresas |
title_full |
Uso de text mining na determinação da relação entre instituições de investigação e empresas |
title_fullStr |
Uso de text mining na determinação da relação entre instituições de investigação e empresas |
title_full_unstemmed |
Uso de text mining na determinação da relação entre instituições de investigação e empresas |
title_sort |
Uso de text mining na determinação da relação entre instituições de investigação e empresas |
author |
Silva, Sérgio Ricardo Magalhães Marques da |
author_facet |
Silva, Sérgio Ricardo Magalhães Marques da |
author_role |
author |
dc.contributor.none.fl_str_mv |
Azevedo, Filipe Miguel Tavares de Repositório Científico do Instituto Politécnico do Porto |
dc.contributor.author.fl_str_mv |
Silva, Sérgio Ricardo Magalhães Marques da |
dc.subject.por.fl_str_mv |
Transferência e valorização do conhecimento Unidades de investigação Empresas Text mining Topic modeling Ferramenta web Knowledge transfer and valorization Research units Companies Web tool |
topic |
Transferência e valorização do conhecimento Unidades de investigação Empresas Text mining Topic modeling Ferramenta web Knowledge transfer and valorization Research units Companies Web tool |
description |
A excelência da investigação científica produzida é indissociável da inovação e criação de valor económico e social. Assim, a aproximação entre diferentes áreas científicas e de negócio, e a consolidação de formas de colaboração entre as instituições de investigação e o tecido económico e social, potencia a criação, transferência e valorização do conhecimento. Neste processo têm particular importância as unidades de investigação e as empresas, com papeis diferenciados, mas essenciais para completar o ciclo de inovação. No mundo competitivo de hoje, a capacidade de extrair conhecimento útil de dados e tomar decisões de acordo com esse conhecimento é cada vez mais importante e essencial. O processo de aplicação de metodologias para extração de conhecimento a partir de dados textuais é denominado de text mining. A sua utilização tem como benefício a grande quantidade de informação importante latente neste formato e que não está disponível nos formatos clássicos de dados estruturados. Neste trabalho foi desenvolvida uma ferramenta de apoio estratégico, que tem como objetivo potenciar a colaboração entre unidades de investigação e o tecido empresarial. Através de metodologias de text mining, nomeadamente sumário da informação e topic modeling com utilização do modelo Latent Dirichlet Allocation, é analisada a informação disponível nos websites das unidades de investigação e das empresas e são identificadas possíveis relações. É a primeira vez que é analisado este tipo de informação com recurso a metodologias de text mining e com o propósito de potenciar a relação entre estas estruturas. A análise de resultados obtidos permitiu concluir que os mesmos estão dependentes da qualidade da informação disponível nos websites e da representatividade de todas as áreas. Caso estas condições sejam garantidas, esperam-se bons resultados relativos a possíveis relações, tendo sempre em consideração que estes resultados poderão não ser os mais óbvios tendo por base o conhecimento prévio das entidades em análise. Assim, a ferramenta deverá ser utilizada como apoio na tomada de decisão, devendo os resultados obtidos ser analisados de forma crítica e em complemento à experiência de especialistas. |
publishDate |
2022 |
dc.date.none.fl_str_mv |
2022 2022-01-01T00:00:00Z 2023-03-31T11:03:31Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.22/22647 TID:203114000 |
url |
http://hdl.handle.net/10400.22/22647 |
identifier_str_mv |
TID:203114000 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799131567763750912 |