Detalhes bibliográficos
Título da fonte: Repositório Institucional da UFMG
id UFMG_8c46791183067c7f991371b07987d970
oai_identifier_str oai:repositorio.ufmg.br:1843/38044
network_acronym_str UFMG
network_name_str Repositório Institucional da UFMG
repository_id_str
reponame_str Repositório Institucional da UFMG
instacron_str UFMG
institution Universidade Federal de Minas Gerais (UFMG)
instname_str Universidade Federal de Minas Gerais (UFMG)
spelling Maurício Barcellos Almeidahttp://lattes.cnpq.br/5218069708058487Fernanda FarinelliZilma Silveira Nogueira ReisGuilherme Ataíde DiasLívia Marangon Duffles TeixeiraJoão Oscar de Almeida Falcão JúniorEduardo Ribeiro Felipehttp://lattes.cnpq.br/3615797323442040Amanda Damasceno de Souza2021-09-16T16:35:35Z2021-09-16T16:35:35Z2021-05-21http://hdl.handle.net/1843/38044https://orcid.org/0000-0001-6859-4333O Prontuário Eletrônico do Paciente (PEP) representa uma importante fonte de informação real, em saúde. A maioria das informações em PEPs são disponibilizadas como dados não estruturados, ou seja, em formato de texto livre, extraído de amostras de linguagem natural. Os profissionais de saúde que preenchem PEPs, muitas vezes, se valem de jargão, siglas e expressões de seu cotidiano. Ainda que tais expressões sejam conhecidas na área médica e permitam agilidade na digitação da PEP, não são padronizadas e podem variar entre os diferentes profissionais. Os avanços das tecnologias de informação em saúde têm demonstrado ser essenciais padronizar terminologias em textos clínicos, com vistas a recuperação de informação e interoperabilidade. Os dados não estruturados do PEP, por sua variedade terminológica e idiossincrasia, não correspondem a terminologias clínicas padronizadas. Esse fato resulta em dificuldades na recuperação de informação e na integração entre sistemas de diversas unidades de saúde, até no âmbito de uma mesma unidade. Dentre outras providências, fazem-se necessárias melhorias na comunicação entre profissionais envolvidos no cuidado aos pacientes na descoberta e produção de conhecimento, em benefício da saúde e, consequentemente, da qualidade de vida dos pacientes. Isso exige algum tipo de harmonização entre os termos registrados, coloquialmente, pelos profissionais e as terminologias. Essa pesquisa busca preencher essas lacunas, ao abordar a falta de padronização terminológica dos PEPs que impacta sobremaneira a recuperação de informação. Para tal, o objetivo geral é definir um mecanismo de conexão de termos clínicos – linguagem natural versus linguagem padronizada – verificando a porcentagem de termos que se correspondem, em um conjunto de dados de uma especialidade médica, de forma a estabelecer a forma de conexão entre as terminologias clínicas. Em uma abordagem interdisciplinar, envolvendo a Biblioteconomia e Ciência da Informação, Tecnologia da Informação e áreas de saúde, desenvolve-se pesquisa aplicada, de abordagem qualitativa, quantitativa e descritiva. A metodologia inclui técnicas de Processamento de Linguagem Natural para extração e análise dos textos clínicos para, ao final, verificar o nível de conexão entre os recursos terminológicos de norma ABNT, para mapeamento de terminologias clínicas. Em termos de resultados, das 18.256 anamneses e 14.035 evoluções da amostra foram retirados 1.364.364 termos, e os resultados de mapeamento indicam que a conexão entre terminologias clínicas ainda precisa ser trabalhada, pois, com uma amostra pequena de termos, um número significativo não obteve equivalência nas terminologias de Referência e Agregação. Entretanto, essa amostra demonstrou a riqueza de termos da Terminologia de Interface, o que será útil no enriquecimento da Terminologia de Referência. Uma contribuição adicional da pesquisa é a criação de uma amostra léxico computacional (corpus em saúde) no idioma português, para delimitar algoritmo no domínio da Ginecologia. Os principais problemas encontrados no processamento automático foram: ambiguidade gramatical, sinonímias, abreviaturas, erros ortográficos ou expressões de negação. No mapeamento entre as terminologias, as principais dificuldades foram semânticas: termos diferentes com o mesmo significado, ausência de termos correspondentes e de sinônimos.The Electronic Healthcare Record (EHR) is an important source of real healthcare information. In general, information in EHRs is made available as unstructured data, that is, in free text format extracted from natural language samples. Healthcare professionals who fill EHRs often use jargon, acronyms and expressions of their routine. Although such expressions are known within the medical field and allow a quick typing of EHRs, they are not standardized and may vary between different professionals. Advances in healthcare information technologies have made it essential to standardize terminologies in clinical texts aiming improvements in information retrieval and interoperability. The unstructured data of EHRs, due to their variety of terminology and idiosyncrasy, do not correspond to standardized clinical terminologies. This fact results in difficulties in the information retrieval and in the integration between systems healthcare units, and even within the same unit. Improvements are needed in communication between professionals involved in care, mainly in the discovery and production of knowledge, to mention a few, for the benefit of healthcare and, consequently, better life quality of patients. This requires some kind of harmonization between the terms registered colloquially by professionals and terminologies. This research seeks to fill these gaps, by addressing the lack of terminological standardization of EHRs that greatly impacts information retrieval. To this end, our goal is to define a mechanism for connecting clinical terms - natural language versus standardized language - in verifying the percentage of terms that correspond to a set of data from a medical specialty, in order to establish the connection between clinical terminologies. Within an interdisciplinary approach - involving Librarianship and Information Science, information technology and healthcare fields - we developed an applied research, with a qualitative, quantitative and descriptive approach. The methodology includes Natural Language Processing techniques for the extraction and analysis of clinical texts to, ultimately, verify the level of connection between ABNT standard terminological resources for mapping clinical terminologies. Concerning the results, from 18,256 anamnesis and 14,035 patient evolution records in the sample, we obtain 1,364,364 terms and the results indicate that the connection between clinical terminologies is it still needs to be worked on, because even with a sample of terms a significant number has not obtained equivalence in the Reference and Aggregation terminologies. However, this sample demonstrated the richness of terms in Interface Terminology, which will be useful in enriching Reference Terminology. An additional contribution was the creation of a computational lexicon (corpus in healthcare) in Portuguese that can help to create algorithms for the domain of Gynecology. The main problems during the natural language processing were: grammatical ambiguity, synonyms, abbreviations, spelling errors or negation expressions. In the mapping between the terminologies, the main difficulties were related to semantics: different terms with the same meaning, absence of the corresponding terms, and synonyms not identified.porUniversidade Federal de Minas GeraisPrograma de Pós-Graduação em Gestão e Organização do ConhecimentoUFMGBrasilECI - ESCOLA DE CIENCIA DA INFORMAÇÃOhttp://creativecommons.org/licenses/by-nc-nd/3.0/pt/info:eu-repo/semantics/openAccessCiência da informaçãoOntologias (recuperação da informação)Processamento da linguagem naturalArquivos médicosMineração de dados (computação)Sistemas de recuperação da informação (saúde pública)Prontuário eletrônico do pacienteOntologias biomédicasTerminologiasDados clínicosProcessamento de linguagem naturalGinecologia e ObstetríciaO discurso na prática clínica e as terminologias de padronização: investigando a conexãoinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisreponame:Repositório Institucional da UFMGinstname:Universidade Federal de Minas Gerais (UFMG)instacron:UFMGORIGINALTESE_PPGGOC_DISCURSO_NA_PRATICA_CLÍNICA_E_AS_TERMINOLOGIAS_DE_PADRONIZACAO_ Amanda_Souza_FINAL_30_JULHO_2021A.pdfTESE_PPGGOC_DISCURSO_NA_PRATICA_CLÍNICA_E_AS_TERMINOLOGIAS_DE_PADRONIZACAO_ Amanda_Souza_FINAL_30_JULHO_2021A.pdfapplication/pdf12506684https://repositorio.ufmg.br/bitstream/1843/38044/1/TESE_PPGGOC_DISCURSO_NA_PRATICA_CL%c3%8dNICA_E_AS_TERMINOLOGIAS_DE_PADRONIZACAO_%20Amanda_Souza_FINAL_30_JULHO_2021A.pdf1acec39e2da05315878721e4051e8fa4MD51CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8811https://repositorio.ufmg.br/bitstream/1843/38044/2/license_rdfcfd6801dba008cb6adbd9838b81582abMD52LICENSElicense.txtlicense.txttext/plain; charset=utf-82118https://repositorio.ufmg.br/bitstream/1843/38044/3/license.txtcda590c95a0b51b4d15f60c9642ca272MD531843/380442021-09-16 13:35:35.889oai:repositorio.ufmg.br:1843/38044TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEgRE8gUkVQT1NJVMOTUklPIElOU1RJVFVDSU9OQUwgREEgVUZNRwoKQ29tIGEgYXByZXNlbnRhw6fDo28gZGVzdGEgbGljZW7Dp2EsIHZvY8OqIChvIGF1dG9yIChlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSBhbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIChSSS1VRk1HKSBvIGRpcmVpdG8gbsOjbyBleGNsdXNpdm8gZSBpcnJldm9nw6F2ZWwgZGUgcmVwcm9kdXppciBlL291IGRpc3RyaWJ1aXIgYSBzdWEgcHVibGljYcOnw6NvIChpbmNsdWluZG8gbyByZXN1bW8pIHBvciB0b2RvIG8gbXVuZG8gbm8gZm9ybWF0byBpbXByZXNzbyBlIGVsZXRyw7RuaWNvIGUgZW0gcXVhbHF1ZXIgbWVpbywgaW5jbHVpbmRvIG9zIGZvcm1hdG9zIMOhdWRpbyBvdSB2w61kZW8uCgpWb2PDqiBkZWNsYXJhIHF1ZSBjb25oZWNlIGEgcG9sw610aWNhIGRlIGNvcHlyaWdodCBkYSBlZGl0b3JhIGRvIHNldSBkb2N1bWVudG8gZSBxdWUgY29uaGVjZSBlIGFjZWl0YSBhcyBEaXJldHJpemVzIGRvIFJJLVVGTUcuCgpWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRk1HIHBvZGUsIHNlbSBhbHRlcmFyIG8gY29udGXDumRvLCB0cmFuc3BvciBhIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBxdWFscXVlciBtZWlvIG91IGZvcm1hdG8gcGFyYSBmaW5zIGRlIHByZXNlcnZhw6fDo28uCgpWb2PDqiB0YW1iw6ltIGNvbmNvcmRhIHF1ZSBvIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGTUcgcG9kZSBtYW50ZXIgbWFpcyBkZSB1bWEgY8OzcGlhIGRlIHN1YSBwdWJsaWNhw6fDo28gcGFyYSBmaW5zIGRlIHNlZ3VyYW7Dp2EsIGJhY2stdXAgZSBwcmVzZXJ2YcOnw6NvLgoKVm9jw6ogZGVjbGFyYSBxdWUgYSBzdWEgcHVibGljYcOnw6NvIMOpIG9yaWdpbmFsIGUgcXVlIHZvY8OqIHRlbSBvIHBvZGVyIGRlIGNvbmNlZGVyIG9zIGRpcmVpdG9zIGNvbnRpZG9zIG5lc3RhIGxpY2Vuw6dhLiBWb2PDqiB0YW1iw6ltIGRlY2xhcmEgcXVlIG8gZGVww7NzaXRvIGRlIHN1YSBwdWJsaWNhw6fDo28gbsOjbywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgaW5mcmluZ2UgZGlyZWl0b3MgYXV0b3JhaXMgZGUgbmluZ3XDqW0uCgpDYXNvIGEgc3VhIHB1YmxpY2HDp8OjbyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvIGRhIHB1YmxpY2HDp8OjbyBvcmEgZGVwb3NpdGFkYS4KCkNBU08gQSBQVUJMSUNBw4fDg08gT1JBIERFUE9TSVRBREEgVEVOSEEgU0lETyBSRVNVTFRBRE8gREUgVU0gUEFUUk9Dw41OSU8gT1UgQVBPSU8gREUgVU1BIEFHw4pOQ0lBIERFIEZPTUVOVE8gT1UgT1VUUk8gT1JHQU5JU01PLCBWT0PDiiBERUNMQVJBIFFVRSBSRVNQRUlUT1UgVE9ET1MgRSBRVUFJU1FVRVIgRElSRUlUT1MgREUgUkVWSVPDg08gQ09NTyBUQU1Cw4lNIEFTIERFTUFJUyBPQlJJR0HDh8OVRVMgRVhJR0lEQVMgUE9SIENPTlRSQVRPIE9VIEFDT1JETy4KCk8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZNRyBzZSBjb21wcm9tZXRlIGEgaWRlbnRpZmljYXIgY2xhcmFtZW50ZSBvIHNldSBub21lKHMpIG91IG8ocykgbm9tZXMocykgZG8ocykgZGV0ZW50b3IoZXMpIGRvcyBkaXJlaXRvcyBhdXRvcmFpcyBkYSBwdWJsaWNhw6fDo28sIGUgbsOjbyBmYXLDoSBxdWFscXVlciBhbHRlcmHDp8OjbywgYWzDqW0gZGFxdWVsYXMgY29uY2VkaWRhcyBwb3IgZXN0YSBsaWNlbsOnYS4KRepositório InstitucionalPUBhttps://repositorio.ufmg.br/oaiopendoar:2021-09-16T16:35:35Repositório Institucional da UFMG - Universidade Federal de Minas Gerais (UFMG)false
_version_ 1813547926277849088