Metodologia para estruturação de informações de laudos radiológicos

Detalhes bibliográficos
Autor(a) principal: Flavio Barbosa
Data de Publicação: 2013
Tipo de documento: Tese
Idioma: por
Título da fonte: Biblioteca Digital de Teses e Dissertações da USP
Texto Completo: https://doi.org/10.11606/T.17.2013.tde-26032014-103153
Resumo: Introdução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro.
id USP_a486c64fb4e57959a0fbc5d65cea28a1
oai_identifier_str oai:teses.usp.br:tde-26032014-103153
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis Metodologia para estruturação de informações de laudos radiológicos Methodology for structuring information from radiological reports 2013-10-25Valdair Francisco MugliaJorge Elias JúniorHarley Francisco de OliveiraAlexandre Leite RangelAgma Juci Machado TrainaFlavio BarbosaUniversidade de São PauloMedicina (Clínica Médica)USPBR estruturação da informação free-text Laudo radiológico ontologia ontology Radiological report structuring information terminologia terminology texto livre Introdução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro. Introduction: The radiological report with structured data entry provides precision in information retrieval, however, is less comprehensive than the text-free and may prevent the expert to describe an important finding, not covered by the pre-defined structure. So the solution is to interpret the text written by expert and carry for a computational framework formalizing the ontological knowledge. Objectives: Develop and evaluate a methodology for structuring information in free text radiology reports that contemplates the Brazilian specifications, including terminology. Methods: 1701 radiological reports of lumbosacral MRI were collected in three different institutions. To structure the information we used techniques of text mining and ontological conceptualization of lexical units extracted. Ten dedicated radiologists evaluated the textual superstructure and terminology extracted by the electronic questionnaire which were suggested textual 3 superstructures and 30 terms with the description of its concept. Results: The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. We identified three different textual superstructures. After automatic processing initial 6129 lexical units were normalized getting 4568 candidate terms of which 4183 were conceptualized and originated 727 concepts. 13963 were established relations between candidate terms and concepts and 789 relations between concepts. As for adequate description of the terms, 40% of the evaluators agree fully that are appropriate, 60% somewhat agree that they are adequate and no evaluator disagreed that the terms are adequate. Regarding the number of words used by evaluators in their respective institution using 70% between 24 and 30 terms and 30% from 16 to 23 terms. The conceptualization of a term was considered inadequate by two evaluators. The established methodology consisted of six steps: 1) collection of radiology reports of certain type of examination; 2) textual decomposition; 3) lexical units normalization; 4) textual superstructures identification ; 5) conceptualization of candidate terms; 6) evaluation of identified superstructures and terminology extracted by experts in the specialized language study. Conclusions: The proposed methodology was evaluated by radiologists who identified the differences between the textual superstructures institutions and the terms describing the relevant concept. Therefore, it was possible to structure the information of the lumbosacral spine radiology reports from free text by identifying textual superstructures, extracting lexical units, normalizing the lexical units and conceptualizing the terms ontologically candidates preserving the reference to the respective constituent parts of radiology reports produced in the Brazilian context. https://doi.org/10.11606/T.17.2013.tde-26032014-103153info:eu-repo/semantics/openAccessporreponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USP2023-12-21T20:11:10Zoai:teses.usp.br:tde-26032014-103153Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-12-22T13:19:34.837125Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.pt.fl_str_mv Metodologia para estruturação de informações de laudos radiológicos
dc.title.alternative.en.fl_str_mv Methodology for structuring information from radiological reports
title Metodologia para estruturação de informações de laudos radiológicos
spellingShingle Metodologia para estruturação de informações de laudos radiológicos
Flavio Barbosa
title_short Metodologia para estruturação de informações de laudos radiológicos
title_full Metodologia para estruturação de informações de laudos radiológicos
title_fullStr Metodologia para estruturação de informações de laudos radiológicos
title_full_unstemmed Metodologia para estruturação de informações de laudos radiológicos
title_sort Metodologia para estruturação de informações de laudos radiológicos
author Flavio Barbosa
author_facet Flavio Barbosa
author_role author
dc.contributor.advisor1.fl_str_mv Valdair Francisco Muglia
dc.contributor.referee1.fl_str_mv Jorge Elias Júnior
dc.contributor.referee2.fl_str_mv Harley Francisco de Oliveira
dc.contributor.referee3.fl_str_mv Alexandre Leite Rangel
dc.contributor.referee4.fl_str_mv Agma Juci Machado Traina
dc.contributor.author.fl_str_mv Flavio Barbosa
contributor_str_mv Valdair Francisco Muglia
Jorge Elias Júnior
Harley Francisco de Oliveira
Alexandre Leite Rangel
Agma Juci Machado Traina
description Introdução: O laudo radiológico com entrada de dados estruturada proporciona precisão na recuperação de informações, todavia, é menos abrangente que o texto-livre e pode impedir o especialista de descrever um achado importante, não contemplado pela estrutura pré-definida. Portanto, a solução está em interpretar o texto escrito pelo especialista e os transportar para uma estrutura computacional ontológica formalizando o conhecimento. Objetivos: Elaborar e avaliar uma metodologia para estruturação de informações de laudos radiológicos em texto livre que contemple as especificidades brasileiras, incluindo a terminologia empregada. Métodos: Coleta de 1701 laudos radiológicos de ressonância magnética da coluna lombossacra em três instituições distintas. Para estruturar a informação, foram utilizadas técnicas de mineração de texto e conceituação ontológica das unidades lexicais. Dez radiologistas especialistas avaliaram a superestrutura textual e a terminologia extraída e conceituada, por meio de questionário eletrônico onde foram sugeridas 3 superestruturas textuais e 30 termos com a descrição do respectivo conceito. Resultados: A metodologia criada é constituída por 6 passos: 1) coleta dos laudos radiológicos de determinado tipo de exame; 2) decomposição textual; 3) normalização das unidades lexicais; 4) identificação das superestruturas textuais; 5) conceituação dos termos candidatos; 6) avaliação das superestruturas identificadas e da terminologia extraída e conceituada pelos especialistas na linguagem de especialidade estudada. Foram identificadas três superestruturas textuais diferentes. Após processamento automático inicial, 6129 unidades lexicais foram normalizadas obtendo 4568 termos candidatos dos quais 4183 foram conceituados e originaram 727 conceitos. Foram estabelecidas 13963 relações entre termos candidatos e conceitos, e 789 relações entre conceitos. Quanto a adequada descrição dos termos, 40% dos avaliadores concordam plenamente que estão adequados, 60% concordam parcialmente que estão adequados e nenhum avaliador discordou que os termos são adequados. Em relação a quantidade de termos utilizados pelos avaliadores, em sua respectiva instituição, 70% utilizam de 24 a 30 termos e 30% de 16 a 23 termos. A conceituação de um termo foi considerada inadequada por dois avaliadores. Conclusão: A metodologia proposta foi avaliada por radiologistas especialistas que identificaram as diferenças das superestruturas textuais entre as instituições e os termos com a descrição do respectivo conceito. Portanto, foi possível estruturar a informação de laudos radiológicos da coluna lombossacra a partir do texto livre identificando as superestruturas textuais, extraindo as unidades lexicais, normalizando as unidades lexicais e conceituando ontologicamente os termos candidatos preservando a referência com as respectivas partes constituintes dos laudos radiológicos produzidos no contexto brasileiro.
publishDate 2013
dc.date.issued.fl_str_mv 2013-10-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://doi.org/10.11606/T.17.2013.tde-26032014-103153
url https://doi.org/10.11606/T.17.2013.tde-26032014-103153
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade de São Paulo
dc.publisher.program.fl_str_mv Medicina (Clínica Médica)
dc.publisher.initials.fl_str_mv USP
dc.publisher.country.fl_str_mv BR
publisher.none.fl_str_mv Universidade de São Paulo
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1794503059282329600