Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região

Detalhes bibliográficos
Autor(a) principal: Morais, Ana Paula Barbosa de
Data de Publicação: 2022
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/30297
Resumo: A Inovação é frequentemente vista como o alicerce para o sucesso em muitas áreas, como empresas e até mesmo países, mas há dificuldades em mensurá-la. Apesar de estar presente em diversas áreas, inclusive no contexto de inovação, o machine learning (ML) ainda não foi utilizado para destacar características inovadoras em empresas. Este trabalho tem como objetivo empregar técnicas de machine learning (ML) não supervisionadas para a formação de grupos (clusters) de empresas de Londrina e região para discutir como as variáveis relacionadas à inovação se diferenciam entre os clusters formados. Para isso, elaborou-se um instrumento de coleta de dados com base na CIS 4 (Quarta Pesquisa de Inovação da Comunidade) criada pela Eurostat e na PINTEC (Pesquisa Industrial de Inovação Tecnológica). Após a criação do instrumento de coleta, enviou-se a uma amostra de empresas de Londrina e região. Para extração de conhecimento da base de dados obtida, foram utilizadas quatro técnicas de agrupamento: K-means, K-means com PCA, agrupamento hierárquico, e agrupamento hierárquico com PCA. Como resultado, foram semelhantes as distribuições das empresas nos dois clusters criados para todos os algoritmos. Identificou-se que em um dos clusters foram alocadas empresas com maior grau de inovação, enquanto no outro, as empresas com menor grau. Então foram feitas análises, com embasamento teórico, de três variáveis no contexto de inovação que obtiveram mais diferenças entre clusters formados: investimento regular em P&D, parcerias feitas com diferentes categorias para inovar e solicitações e/ou registros. Ao final, verificou-se que essas variáveis foram consideradas importantes para a caracterização do cluster mais inovador, porém os resultados indicaram que uma maior amostra deve ser coletada para validar os resultados obtidos inicialmente por esta pesquisa.
id UTFPR-12_c06d1a5ca3f54eed77b0f802a3045e3a
oai_identifier_str oai:repositorio.utfpr.edu.br:1/30297
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling 2022-12-13T21:23:24Z2022-12-13T21:23:24Z2022-11-23MORAIS, Ana Paula Barbosa de. Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2022.http://repositorio.utfpr.edu.br/jspui/handle/1/30297A Inovação é frequentemente vista como o alicerce para o sucesso em muitas áreas, como empresas e até mesmo países, mas há dificuldades em mensurá-la. Apesar de estar presente em diversas áreas, inclusive no contexto de inovação, o machine learning (ML) ainda não foi utilizado para destacar características inovadoras em empresas. Este trabalho tem como objetivo empregar técnicas de machine learning (ML) não supervisionadas para a formação de grupos (clusters) de empresas de Londrina e região para discutir como as variáveis relacionadas à inovação se diferenciam entre os clusters formados. Para isso, elaborou-se um instrumento de coleta de dados com base na CIS 4 (Quarta Pesquisa de Inovação da Comunidade) criada pela Eurostat e na PINTEC (Pesquisa Industrial de Inovação Tecnológica). Após a criação do instrumento de coleta, enviou-se a uma amostra de empresas de Londrina e região. Para extração de conhecimento da base de dados obtida, foram utilizadas quatro técnicas de agrupamento: K-means, K-means com PCA, agrupamento hierárquico, e agrupamento hierárquico com PCA. Como resultado, foram semelhantes as distribuições das empresas nos dois clusters criados para todos os algoritmos. Identificou-se que em um dos clusters foram alocadas empresas com maior grau de inovação, enquanto no outro, as empresas com menor grau. Então foram feitas análises, com embasamento teórico, de três variáveis no contexto de inovação que obtiveram mais diferenças entre clusters formados: investimento regular em P&D, parcerias feitas com diferentes categorias para inovar e solicitações e/ou registros. Ao final, verificou-se que essas variáveis foram consideradas importantes para a caracterização do cluster mais inovador, porém os resultados indicaram que uma maior amostra deve ser coletada para validar os resultados obtidos inicialmente por esta pesquisa.Innovation is often seen as the foundation for success in many areas, such as companies and even countries, but there are difficulties in measuring it. Despite being present in several areas, including in the context of innovation, machine learning (ML) has not yet been used to highlight innovative features in companies. This work aims to employ unsupervised machine learning (ML) techniques for the formation of groups (clusters) of companies in Londrina and region to discuss how the variables related to innovation differ between the formed clusters. For this, a data collection instrument was developed based on CIS 4 (Fourth Community Innovation Survey) created by Eurostat and PINTEC (Industrial Research on Technological Innovation). After creating the collection instrument, a sample of companies in Londrina and region was sent. To extract knowledge from the obtained database, four clustering techniques were used: K-means, K-means with PCA, hierarchical clustering, and hierarchical clustering with PCA. As a result, the companies' distributions in the two clusters created for all algorithms were similar. It was identified that in one of the clusters were allocated companies with a higher degree of innovation, while in the other, companies with a lower degree. Then, analyzes were carried out, with theoretical basis, of three variables in the context of innovation that obtained more differences between clusters formed: regular investment in R&D, partnerships made with different categories to innovate and requests and/or registrations. In the end, it was verified that these variables were considered important for the characterization of the most innovative cluster, however the results indicated that a larger sample should be collected to validate the results obtained initially by this research.porUniversidade Tecnológica Federal do ParanáLondrinaEngenharia de ProduçãoUTFPRBrasilhttp://creativecommons.org/licenses/by/4.0/info:eu-repo/semantics/openAccessCNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAOAprendizado do computadorAnálise por agrupamentoInovações tecnológicasMachine LearningCluster analysisTechnological innovationsTécnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e regiãoClustering techniques and comparison of groups based on innovation characteristics of companies in Londrina and regioninfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisLondrinaSantos, Bruno Samways dosSantos, Bruno Samways dosAndrade, Pedro Rochavetz de LaraLima, Rafael Henrique PalmaMorais, Ana Paula Barbosa dereponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRORIGINALclusterizacaoempresaslondrina.pdfclusterizacaoempresaslondrina.pdfapplication/pdf704967http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/1/clusterizacaoempresaslondrina.pdf217b48436c879d8043894c7add051f6aMD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8908http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/2/license_rdf0175ea4a2d4caec4bbcc37e300941108MD52LICENSElicense.txtlicense.txttext/plain; charset=utf-81290http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/3/license.txtb9d82215ab23456fa2d8b49c5df1b95bMD53TEXTclusterizacaoempresaslondrina.pdf.txtclusterizacaoempresaslondrina.pdf.txtExtracted texttext/plain88527http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/4/clusterizacaoempresaslondrina.pdf.txt3c15154d78ceff0763d440ff277a04f8MD54THUMBNAILclusterizacaoempresaslondrina.pdf.jpgclusterizacaoempresaslondrina.pdf.jpgGenerated Thumbnailimage/jpeg1221http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/5/clusterizacaoempresaslondrina.pdf.jpg62c1a48bff52e040fd4fa432d9846a03MD551/302972022-12-14 04:07:02.804oai:repositorio.utfpr.edu.br:1/30297TmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbywgYXV0b3Jpem8gYSBVVEZQUiBhIHZlaWN1bGFyLCAKYXRyYXbDqXMgZG8gUG9ydGFsIGRlIEluZm9ybWHDp8OjbyBlbSBBY2Vzc28gQWJlcnRvIChQSUFBKSBlIGRvcyBDYXTDoWxvZ29zIGRhcyBCaWJsaW90ZWNhcyAKZGVzdGEgSW5zdGl0dWnDp8Ojbywgc2VtIHJlc3NhcmNpbWVudG8gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBkZSBhY29yZG8gY29tIGEgTGVpIG5vIDkuNjEwLzk4LCAKbyB0ZXh0byBkZXN0YSBvYnJhLCBvYnNlcnZhbmRvIGFzIGNvbmRpw6fDtWVzIGRlIGRpc3BvbmliaWxpemHDp8OjbyByZWdpc3RyYWRhcyBubyBpdGVtIDQgZG8gCuKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgVHJhYmFsaG9zIGRlIENvbmNsdXPDo28gZGUgQ3Vyc28gZGUgR3JhZHVhw6fDo28gZSAKRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgZGUgSW5mb3JtYcOnw6NvIGUgbm9zIENhdMOhbG9nb3MgRWxldHLDtG5pY29zIGRvIApTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdLCBwYXJhIGZpbnMgZGUgbGVpdHVyYSwgaW1wcmVzc8OjbyBlL291IGRvd25sb2FkLCB2aXNhbmRvIGEgCmRpdnVsZ2HDp8OjbyBkYSBwcm9kdcOnw6NvIGNpZW50w61maWNhIGJyYXNpbGVpcmEuCgogIEFzIHZpYXMgb3JpZ2luYWlzIGUgYXNzaW5hZGFzIHBlbG8ocykgYXV0b3IoZXMpIGRvIOKAnFRlcm1vIGRlIEF1dG9yaXphw6fDo28gcGFyYSBQdWJsaWNhw6fDo28gZGUgClRyYWJhbGhvcyBkZSBDb25jbHVzw6NvIGRlIEN1cnNvIGRlIEdyYWR1YcOnw6NvIGUgRXNwZWNpYWxpemHDp8OjbywgRGlzc2VydGHDp8O1ZXMgZSBUZXNlcyBubyBQb3J0YWwgCmRlIEluZm9ybWHDp8OjbyBlIG5vcyBDYXTDoWxvZ29zIEVsZXRyw7RuaWNvcyBkbyBTaXN0ZW1hIGRlIEJpYmxpb3RlY2FzIGRhIFVURlBS4oCdIGUgZGEg4oCcRGVjbGFyYcOnw6NvIApkZSBBdXRvcmlh4oCdIGVuY29udHJhbS1zZSBhcnF1aXZhZGFzIG5hIEJpYmxpb3RlY2EgZG8gQ8OibXB1cyBubyBxdWFsIG8gdHJhYmFsaG8gZm9pIGRlZmVuZGlkby4gCk5vIGNhc28gZGUgcHVibGljYcOnw7VlcyBkZSBhdXRvcmlhIGNvbGV0aXZhIGUgbXVsdGljw6JtcHVzLCBvcyBkb2N1bWVudG9zIGZpY2Fyw6NvIHNvYiBndWFyZGEgZGEgCkJpYmxpb3RlY2EgY29tIGEgcXVhbCBvIOKAnHByaW1laXJvIGF1dG9y4oCdIHBvc3N1YSB2w61uY3Vsby4KRepositório de PublicaçõesPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestopendoar:2022-12-14T06:07:02Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.pt_BR.fl_str_mv Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
dc.title.alternative.pt_BR.fl_str_mv Clustering techniques and comparison of groups based on innovation characteristics of companies in Londrina and region
title Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
spellingShingle Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
Morais, Ana Paula Barbosa de
CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Aprendizado do computador
Análise por agrupamento
Inovações tecnológicas
Machine Learning
Cluster analysis
Technological innovations
title_short Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
title_full Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
title_fullStr Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
title_full_unstemmed Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
title_sort Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região
author Morais, Ana Paula Barbosa de
author_facet Morais, Ana Paula Barbosa de
author_role author
dc.contributor.advisor1.fl_str_mv Santos, Bruno Samways dos
dc.contributor.referee1.fl_str_mv Santos, Bruno Samways dos
dc.contributor.referee2.fl_str_mv Andrade, Pedro Rochavetz de Lara
dc.contributor.referee3.fl_str_mv Lima, Rafael Henrique Palma
dc.contributor.author.fl_str_mv Morais, Ana Paula Barbosa de
contributor_str_mv Santos, Bruno Samways dos
Santos, Bruno Samways dos
Andrade, Pedro Rochavetz de Lara
Lima, Rafael Henrique Palma
dc.subject.cnpq.fl_str_mv CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
topic CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO
Aprendizado do computador
Análise por agrupamento
Inovações tecnológicas
Machine Learning
Cluster analysis
Technological innovations
dc.subject.por.fl_str_mv Aprendizado do computador
Análise por agrupamento
Inovações tecnológicas
Machine Learning
Cluster analysis
Technological innovations
description A Inovação é frequentemente vista como o alicerce para o sucesso em muitas áreas, como empresas e até mesmo países, mas há dificuldades em mensurá-la. Apesar de estar presente em diversas áreas, inclusive no contexto de inovação, o machine learning (ML) ainda não foi utilizado para destacar características inovadoras em empresas. Este trabalho tem como objetivo empregar técnicas de machine learning (ML) não supervisionadas para a formação de grupos (clusters) de empresas de Londrina e região para discutir como as variáveis relacionadas à inovação se diferenciam entre os clusters formados. Para isso, elaborou-se um instrumento de coleta de dados com base na CIS 4 (Quarta Pesquisa de Inovação da Comunidade) criada pela Eurostat e na PINTEC (Pesquisa Industrial de Inovação Tecnológica). Após a criação do instrumento de coleta, enviou-se a uma amostra de empresas de Londrina e região. Para extração de conhecimento da base de dados obtida, foram utilizadas quatro técnicas de agrupamento: K-means, K-means com PCA, agrupamento hierárquico, e agrupamento hierárquico com PCA. Como resultado, foram semelhantes as distribuições das empresas nos dois clusters criados para todos os algoritmos. Identificou-se que em um dos clusters foram alocadas empresas com maior grau de inovação, enquanto no outro, as empresas com menor grau. Então foram feitas análises, com embasamento teórico, de três variáveis no contexto de inovação que obtiveram mais diferenças entre clusters formados: investimento regular em P&D, parcerias feitas com diferentes categorias para inovar e solicitações e/ou registros. Ao final, verificou-se que essas variáveis foram consideradas importantes para a caracterização do cluster mais inovador, porém os resultados indicaram que uma maior amostra deve ser coletada para validar os resultados obtidos inicialmente por esta pesquisa.
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-12-13T21:23:24Z
dc.date.available.fl_str_mv 2022-12-13T21:23:24Z
dc.date.issued.fl_str_mv 2022-11-23
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv MORAIS, Ana Paula Barbosa de. Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2022.
dc.identifier.uri.fl_str_mv http://repositorio.utfpr.edu.br/jspui/handle/1/30297
identifier_str_mv MORAIS, Ana Paula Barbosa de. Técnicas de clusterização e comparação de grupos baseados nas características de inovação em empresas de Londrina e região. 2022. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Londrina, 2022.
url http://repositorio.utfpr.edu.br/jspui/handle/1/30297
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv http://creativecommons.org/licenses/by/4.0/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv http://creativecommons.org/licenses/by/4.0/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Londrina
dc.publisher.program.fl_str_mv Engenharia de Produção
dc.publisher.initials.fl_str_mv UTFPR
dc.publisher.country.fl_str_mv Brasil
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Londrina
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
bitstream.url.fl_str_mv http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/1/clusterizacaoempresaslondrina.pdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/2/license_rdf
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/3/license.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/4/clusterizacaoempresaslondrina.pdf.txt
http://repositorio.utfpr.edu.br:8080/jspui/bitstream/1/30297/5/clusterizacaoempresaslondrina.pdf.jpg
bitstream.checksum.fl_str_mv 217b48436c879d8043894c7add051f6a
0175ea4a2d4caec4bbcc37e300941108
b9d82215ab23456fa2d8b49c5df1b95b
3c15154d78ceff0763d440ff277a04f8
62c1a48bff52e040fd4fa432d9846a03
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv
_version_ 1805923171551936512