Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos
Autor(a) principal: | |
---|---|
Data de Publicação: | 2021 |
Tipo de documento: | Tese |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da Uninove |
Texto Completo: | http://bibliotecatede.uninove.br/handle/tede/2788 |
Resumo: | In recent years, there has been an increase in the number of authors listed in articles and the issue of authorship and scientific contributions is still open in the literature since there is no formal definition or recommendation for the authors’ position. Objective: In this dissertation, I’ve scrutinized the relationship between scientific contribution and authorship ethical issues. My main objective was to study contributions types and its impact in authorship position. Methodology: I’ve collected 2, 024 articles containing 17, 385 authors from the following data sources: SCImago, Scopus, and the following jour- nals: Annals of Internal Medicine (Ann. Intern. Med.), Journal of the American Medical Association (JAMA), and PLoS Medicine (PLoS Med.). All of those being journals from the biological sciences and medicine areas. To analyze the data I’ve employed statisti- cal techniques, specifically Factor Analysis; and also data science techniques, specifically Linear Regression. Furthermore, for data collection and cleaning automation, I’ve deve- loped robots with data scraping techniques. Results: My study revealed the existence of mainly two scientific contribution categories (“Theory” and “Methodology/Logistics” ). I’ve also proposed an universal categorical model of scientific contribution based on th- ree main categories: theory, methodology, and logistic. Furthermore, I’ve also developed algorithms to automate data collection by robots/crawler. Conclusion: Data science te- chniques have allowed the construction of robots to automate data collection in scientific databases and publications together with developed algorithms, substantially reducing the collection time and improving the accuracy of the processes. The grouping of sci- entific contributions showed that the largest contributions are found in the theoretical group, indicating that the academic experience of the authors is a major factor, while the methodological and logistical contributions represent substantial contributions. The categorical model proposed for the study of the relationship between authorial positioning and scientific contributions shows that authors who contribute theoretically tend to be the first authors. Logistic contributions, on the other hand, tend to place an author last. Methodological contributions do not have an impact on author position. Finally, the small effect registered in the correlation between the contribution variables evidences that the author’s position is not defined by the authors’ contributions. |
id |
NOVE_cd5912e22b987047e9403dffd7063c80 |
---|---|
oai_identifier_str |
oai:localhost:tede/2788 |
network_acronym_str |
NOVE |
network_name_str |
Biblioteca Digital de Teses e Dissertações da Uninove |
repository_id_str |
|
spelling |
Storopoli, José Eduardohttp://lattes.cnpq.br/2281909649311607Storopoli, José Eduardohttp://lattes.cnpq.br/2281909649311607Bido, Diógenes de Souzahttp://lattes.cnpq.br/7757562071320086Chalco, Jesús Pascual Menahttp://lattes.cnpq.br/4727357182510680Vils, Leonardohttp://lattes.cnpq.br/3969955798466284Marns, Fellipe Silvahttp://lattes.cnpq.br/2641658716558510Souza, Edson Melo de2021-12-02T14:36:50Z2021-06-28Souza, Edson Melo de. Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos. 2021. 119 f. Tese( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo.http://bibliotecatede.uninove.br/handle/tede/2788In recent years, there has been an increase in the number of authors listed in articles and the issue of authorship and scientific contributions is still open in the literature since there is no formal definition or recommendation for the authors’ position. Objective: In this dissertation, I’ve scrutinized the relationship between scientific contribution and authorship ethical issues. My main objective was to study contributions types and its impact in authorship position. Methodology: I’ve collected 2, 024 articles containing 17, 385 authors from the following data sources: SCImago, Scopus, and the following jour- nals: Annals of Internal Medicine (Ann. Intern. Med.), Journal of the American Medical Association (JAMA), and PLoS Medicine (PLoS Med.). All of those being journals from the biological sciences and medicine areas. To analyze the data I’ve employed statisti- cal techniques, specifically Factor Analysis; and also data science techniques, specifically Linear Regression. Furthermore, for data collection and cleaning automation, I’ve deve- loped robots with data scraping techniques. Results: My study revealed the existence of mainly two scientific contribution categories (“Theory” and “Methodology/Logistics” ). I’ve also proposed an universal categorical model of scientific contribution based on th- ree main categories: theory, methodology, and logistic. Furthermore, I’ve also developed algorithms to automate data collection by robots/crawler. Conclusion: Data science te- chniques have allowed the construction of robots to automate data collection in scientific databases and publications together with developed algorithms, substantially reducing the collection time and improving the accuracy of the processes. The grouping of sci- entific contributions showed that the largest contributions are found in the theoretical group, indicating that the academic experience of the authors is a major factor, while the methodological and logistical contributions represent substantial contributions. The categorical model proposed for the study of the relationship between authorial positioning and scientific contributions shows that authors who contribute theoretically tend to be the first authors. Logistic contributions, on the other hand, tend to place an author last. Methodological contributions do not have an impact on author position. Finally, the small effect registered in the correlation between the contribution variables evidences that the author’s position is not defined by the authors’ contributions.Contexto: Nos últimos anos houve crescimento do número de autores listados em artigos e a questão do posicionamento autoral e das contribuições científicas ainda se encontra em aberto na literatura, uma vez que não há definição ou recomendação formal para o posicionamento dos autores. Objetivo: Neste trabalho foram estudadas as categorias de contribuição e a questão da posição autoral em relação às contribuições dos autores em publicações científicas na área de ciências biológicas e medicina. Método: O estudo foi realizado utilizando técnicas estatísticas, em especial Análise Fatorial, e de ciência de dados, em especial Regressão Linear sobre os dados de 2.024 artigos contendo 17.385 au- tores das fontes de dados: SCImago, Scopus e dos periódicos da área de ciências biológicas e medicina Annals of Internal Medicine (Anna. Intern. Med.), Journal of the American Medical Association (JAMA) e PLoS Medicine (PLoS Med). Para coleta e limpeza dos dados foram desenvolvidos robôs com técnicas de raspagem de dados para automatização dos processos. Resultados: O estudo mostrou a existência de dois grupos de contri- buição (“Theory” e “Methodology/Logistic” ), além da proposta de um modelo universal de contribuições com três categorias: teórica, metodológica e logística. Ademais, foram desenvolvidos algoritmos para automatização dos tratamentos de dados coletados pelos robôs. Conclusão As técnicas de ciência de dados permitiram a construção de robôs para automatização da coleta de dados em bases e publicações científicas em conjunto com os algoritmos desenvolvidos, reduzindo substancialmente o tempo de coleta e melhorando a acurácia dos processos. O agrupamento das contribuições científicas evidenciou que as maiores contribuições se encontram no grupo teórico, sinalizando que a experiência aca- dêmica dos autores é um fator preponderante, enquanto as contribuições metodológicas e logísticas representam contribuições substanciais. O modelo categórico proposto para o estudo da relação entre o posicionamento autoral e as contribuições científicas mostrou que autores com contribuições teóricas tendem a ser o primeiro autor. Já as contribuições logísticas tendem a posicionar um autor como último. As contribuições metodológicas não evidenciam impacto no posicionamento autoral. Por fim, o pequeno efeito registrado na correlação entre as variáveis de contribuição evidencia que o posicionamento autoral não é definido pelas contribuições dos autores.Submitted by Nadir Basilio (nadirsb@uninove.br) on 2021-12-02T14:36:50Z No. of bitstreams: 1 Edson Melo de Souza.pdf: 8553169 bytes, checksum: b6e70c64cf3cb3cc9cb2e642f6ea121e (MD5)Made available in DSpace on 2021-12-02T14:36:50Z (GMT). No. of bitstreams: 1 Edson Melo de Souza.pdf: 8553169 bytes, checksum: b6e70c64cf3cb3cc9cb2e642f6ea121e (MD5) Previous issue date: 2021-06-28application/pdfporUniversidade Nove de JulhoPrograma de Pós-Graduação em Informática e Gestão do ConhecimentoUNINOVEBrasilInformáticaciência de dadosposição autorallista de contribuiçõesbylinedata scienceauthor positioncontribution listbylineCIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAOAplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigosinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis8930092515683771531600info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da Uninoveinstname:Universidade Nove de Julho (UNINOVE)instacron:UNINOVEORIGINALEdson Melo de Souza.pdfEdson Melo de Souza.pdfapplication/pdf8553169http://localhost:8080/tede/bitstream/tede/2788/2/Edson+Melo+de+Souza.pdfb6e70c64cf3cb3cc9cb2e642f6ea121eMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82165http://localhost:8080/tede/bitstream/tede/2788/1/license.txtbd3efa91386c1718a7f26a329fdcb468MD51tede/27882021-12-02 12:36:50.421oai:localhost:tede/2788Tk9UQTogQ09MT1FVRSBBUVVJIEEgU1VBIFBSw5NQUklBIExJQ0VOw4dBCkVzdGEgbGljZW7Dp2EgZGUgZXhlbXBsbyDDqSBmb3JuZWNpZGEgYXBlbmFzIHBhcmEgZmlucyBpbmZvcm1hdGl2b3MuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgClhYWCAoU2lnbGEgZGEgVW5pdmVyc2lkYWRlKSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUgcmVwcm9kdXppciwgIHRyYWR1emlyIChjb25mb3JtZSBkZWZpbmlkbyBhYmFpeG8pLCBlL291IApkaXN0cmlidWlyIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyAoaW5jbHVpbmRvIG8gcmVzdW1vKSBwb3IgdG9kbyBvIG11bmRvIG5vIGZvcm1hdG8gaW1wcmVzc28gZSBlbGV0csO0bmljbyBlIAplbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIApwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgU2lnbGEgZGUgVW5pdmVyc2lkYWRlIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBhIHN1YSB0ZXNlIG91IApkaXNzZXJ0YcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyAKbmVzdGEgbGljZW7Dp2EuIFZvY8OqIHRhbWLDqW0gZGVjbGFyYSBxdWUgbyBkZXDDs3NpdG8gZGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBuw6NvLCBxdWUgc2VqYSBkZSBzZXUgCmNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHRlc2Ugb3UgZGlzc2VydGHDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiAKZGVjbGFyYSBxdWUgb2J0ZXZlIGEgcGVybWlzc8OjbyBpcnJlc3RyaXRhIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBwYXJhIGNvbmNlZGVyIMOgIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSAKb3MgZGlyZWl0b3MgYXByZXNlbnRhZG9zIG5lc3RhIGxpY2Vuw6dhLCBlIHF1ZSBlc3NlIG1hdGVyaWFsIGRlIHByb3ByaWVkYWRlIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIAppZGVudGlmaWNhZG8gZSByZWNvbmhlY2lkbyBubyB0ZXh0byBvdSBubyBjb250ZcO6ZG8gZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvIG9yYSBkZXBvc2l0YWRhLgoKQ0FTTyBBIFRFU0UgT1UgRElTU0VSVEHDh8ODTyBPUkEgREVQT1NJVEFEQSBURU5IQSBTSURPIFJFU1VMVEFETyBERSBVTSBQQVRST0PDjU5JTyBPVSAKQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PIFFVRSBOw4NPIFNFSkEgQSBTSUdMQSBERSAKVU5JVkVSU0lEQURFLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyAKVEFNQsOJTSBBUyBERU1BSVMgT0JSSUdBw4fDlUVTIEVYSUdJREFTIFBPUiBDT05UUkFUTyBPVSBBQ09SRE8uCgpBIFNpZ2xhIGRlIFVuaXZlcnNpZGFkZSBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lIChzKSBvdSBvKHMpIG5vbWUocykgZG8ocykgCmRldGVudG9yKGVzKSBkb3MgZGlyZWl0b3MgYXV0b3JhaXMgZGEgdGVzZSBvdSBkaXNzZXJ0YcOnw6NvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIApjb25jZWRpZGFzIHBvciBlc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Teses e Dissertaçõeshttp://bibliotecatede.uninove.br/PRIhttp://bibliotecatede.uninove.br/oai/requestbibliotecatede@uninove.br||bibliotecatede@uninove.bropendoar:2021-12-02T14:36:50Biblioteca Digital de Teses e Dissertações da Uninove - Universidade Nove de Julho (UNINOVE)false |
dc.title.por.fl_str_mv |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos |
title |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos |
spellingShingle |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos Souza, Edson Melo de ciência de dados posição autoral lista de contribuições byline data science author position contribution list byline CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
title_short |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos |
title_full |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos |
title_fullStr |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos |
title_full_unstemmed |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos |
title_sort |
Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos |
author |
Souza, Edson Melo de |
author_facet |
Souza, Edson Melo de |
author_role |
author |
dc.contributor.advisor1.fl_str_mv |
Storopoli, José Eduardo |
dc.contributor.advisor1Lattes.fl_str_mv |
http://lattes.cnpq.br/2281909649311607 |
dc.contributor.referee1.fl_str_mv |
Storopoli, José Eduardo |
dc.contributor.referee1Lattes.fl_str_mv |
http://lattes.cnpq.br/2281909649311607 |
dc.contributor.referee2.fl_str_mv |
Bido, Diógenes de Souza |
dc.contributor.referee2Lattes.fl_str_mv |
http://lattes.cnpq.br/7757562071320086 |
dc.contributor.referee3.fl_str_mv |
Chalco, Jesús Pascual Mena |
dc.contributor.referee3Lattes.fl_str_mv |
http://lattes.cnpq.br/4727357182510680 |
dc.contributor.referee4.fl_str_mv |
Vils, Leonardo |
dc.contributor.referee4Lattes.fl_str_mv |
http://lattes.cnpq.br/3969955798466284 |
dc.contributor.referee5.fl_str_mv |
Marns, Fellipe Silva |
dc.contributor.authorLattes.fl_str_mv |
http://lattes.cnpq.br/2641658716558510 |
dc.contributor.author.fl_str_mv |
Souza, Edson Melo de |
contributor_str_mv |
Storopoli, José Eduardo Storopoli, José Eduardo Bido, Diógenes de Souza Chalco, Jesús Pascual Mena Vils, Leonardo Marns, Fellipe Silva |
dc.subject.por.fl_str_mv |
ciência de dados posição autoral lista de contribuições byline |
topic |
ciência de dados posição autoral lista de contribuições byline data science author position contribution list byline CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
dc.subject.eng.fl_str_mv |
data science author position contribution list byline |
dc.subject.cnpq.fl_str_mv |
CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
description |
In recent years, there has been an increase in the number of authors listed in articles and the issue of authorship and scientific contributions is still open in the literature since there is no formal definition or recommendation for the authors’ position. Objective: In this dissertation, I’ve scrutinized the relationship between scientific contribution and authorship ethical issues. My main objective was to study contributions types and its impact in authorship position. Methodology: I’ve collected 2, 024 articles containing 17, 385 authors from the following data sources: SCImago, Scopus, and the following jour- nals: Annals of Internal Medicine (Ann. Intern. Med.), Journal of the American Medical Association (JAMA), and PLoS Medicine (PLoS Med.). All of those being journals from the biological sciences and medicine areas. To analyze the data I’ve employed statisti- cal techniques, specifically Factor Analysis; and also data science techniques, specifically Linear Regression. Furthermore, for data collection and cleaning automation, I’ve deve- loped robots with data scraping techniques. Results: My study revealed the existence of mainly two scientific contribution categories (“Theory” and “Methodology/Logistics” ). I’ve also proposed an universal categorical model of scientific contribution based on th- ree main categories: theory, methodology, and logistic. Furthermore, I’ve also developed algorithms to automate data collection by robots/crawler. Conclusion: Data science te- chniques have allowed the construction of robots to automate data collection in scientific databases and publications together with developed algorithms, substantially reducing the collection time and improving the accuracy of the processes. The grouping of sci- entific contributions showed that the largest contributions are found in the theoretical group, indicating that the academic experience of the authors is a major factor, while the methodological and logistical contributions represent substantial contributions. The categorical model proposed for the study of the relationship between authorial positioning and scientific contributions shows that authors who contribute theoretically tend to be the first authors. Logistic contributions, on the other hand, tend to place an author last. Methodological contributions do not have an impact on author position. Finally, the small effect registered in the correlation between the contribution variables evidences that the author’s position is not defined by the authors’ contributions. |
publishDate |
2021 |
dc.date.accessioned.fl_str_mv |
2021-12-02T14:36:50Z |
dc.date.issued.fl_str_mv |
2021-06-28 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.citation.fl_str_mv |
Souza, Edson Melo de. Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos. 2021. 119 f. Tese( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo. |
dc.identifier.uri.fl_str_mv |
http://bibliotecatede.uninove.br/handle/tede/2788 |
identifier_str_mv |
Souza, Edson Melo de. Aplicação de ciência de dados na análise do posicionamento autoral e contribuições científicas em artigos. 2021. 119 f. Tese( Programa de Pós-Graduação em Informática e Gestão do Conhecimento) - Universidade Nove de Julho, São Paulo. |
url |
http://bibliotecatede.uninove.br/handle/tede/2788 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.cnpq.fl_str_mv |
8930092515683771531 |
dc.relation.confidence.fl_str_mv |
600 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Universidade Nove de Julho |
dc.publisher.program.fl_str_mv |
Programa de Pós-Graduação em Informática e Gestão do Conhecimento |
dc.publisher.initials.fl_str_mv |
UNINOVE |
dc.publisher.country.fl_str_mv |
Brasil |
dc.publisher.department.fl_str_mv |
Informática |
publisher.none.fl_str_mv |
Universidade Nove de Julho |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da Uninove instname:Universidade Nove de Julho (UNINOVE) instacron:UNINOVE |
instname_str |
Universidade Nove de Julho (UNINOVE) |
instacron_str |
UNINOVE |
institution |
UNINOVE |
reponame_str |
Biblioteca Digital de Teses e Dissertações da Uninove |
collection |
Biblioteca Digital de Teses e Dissertações da Uninove |
bitstream.url.fl_str_mv |
http://localhost:8080/tede/bitstream/tede/2788/2/Edson+Melo+de+Souza.pdf http://localhost:8080/tede/bitstream/tede/2788/1/license.txt |
bitstream.checksum.fl_str_mv |
b6e70c64cf3cb3cc9cb2e642f6ea121e bd3efa91386c1718a7f26a329fdcb468 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da Uninove - Universidade Nove de Julho (UNINOVE) |
repository.mail.fl_str_mv |
bibliotecatede@uninove.br||bibliotecatede@uninove.br |
_version_ |
1811016885505884160 |