Suporte à geração de dados abertos ligados em bioinformática
Autor(a) principal: | |
---|---|
Data de Publicação: | 2019 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/59/59143/tde-21012020-225928/ |
Resumo: | Diferentes conjuntos de dados na web encontram-se em formatos que dificultam o processamento e a extração automática de informação. A transformação desses dados em Dados Abertos Ligados (DAL) pode facilitar o processamento e a obtenção de novos conhecimentos. DAL define um conjunto de dados compreendido/interpretável por computadores, interconectado e semanticamente anotado. Diversos domínios de conhecimento podem ser beneficiados com o uso de DAL, dentre os quais destaca-se a bioinformática. A bioinformática é caracterizada pelo uso e a disponibilização de grandes quantidades de dados na web, normalmente armazenados em arquivos texto semiestruturados. Existem diferentes abordagens de transformação de dados estruturados e semiestruturados para DAL no domínio biomédico. Porém, essas abordagens não podem ser facilmente estendidas para a bioinformática. Este trabalho teve por objetivo propor uma abordagem de transformação de dados semiestruturados de bioinformática para DAL, chamada de SSD2LOD Transformation Approach. Esta abordagem é composta por quatro atividades, as quais orientam a definição de questões de competência (perguntas de interesse), a especificação de regras de transformação, a transformação dos dados, e, finalmente, a exploração do conjunto DAL resultante. Adicionamente, desenvolvemos um conjunto de ferramentas de suporte para executar o processo de transformação e exploração dos dados, de modo a facilitar a aplicação da abordagem. Na sequência, aplicamos a abordagem proposta em uma prova de conceito utilizando dados de um experimento de genômica funcional disponibilizado na plataforma ArrayExpress. A abordagem SSD2LOD Transformation Approach representa uma solução adequada para a transformação de dados de bioinformática em DAL, permitindo alcançar os benefícios da web semântica neste domínio. |
id |
USP_d8adb7e2e02925a127934c25cf4400be |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-21012020-225928 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Suporte à geração de dados abertos ligados em bioinformáticaSupport for the generation of linked open data in bioinformaticsBioinformáticaBioinformaticsDados abertos ligadosDados semiestruturadosLinked open dataRegras de transformaçãoSemi-structured dataTransformation rulesDiferentes conjuntos de dados na web encontram-se em formatos que dificultam o processamento e a extração automática de informação. A transformação desses dados em Dados Abertos Ligados (DAL) pode facilitar o processamento e a obtenção de novos conhecimentos. DAL define um conjunto de dados compreendido/interpretável por computadores, interconectado e semanticamente anotado. Diversos domínios de conhecimento podem ser beneficiados com o uso de DAL, dentre os quais destaca-se a bioinformática. A bioinformática é caracterizada pelo uso e a disponibilização de grandes quantidades de dados na web, normalmente armazenados em arquivos texto semiestruturados. Existem diferentes abordagens de transformação de dados estruturados e semiestruturados para DAL no domínio biomédico. Porém, essas abordagens não podem ser facilmente estendidas para a bioinformática. Este trabalho teve por objetivo propor uma abordagem de transformação de dados semiestruturados de bioinformática para DAL, chamada de SSD2LOD Transformation Approach. Esta abordagem é composta por quatro atividades, as quais orientam a definição de questões de competência (perguntas de interesse), a especificação de regras de transformação, a transformação dos dados, e, finalmente, a exploração do conjunto DAL resultante. Adicionamente, desenvolvemos um conjunto de ferramentas de suporte para executar o processo de transformação e exploração dos dados, de modo a facilitar a aplicação da abordagem. Na sequência, aplicamos a abordagem proposta em uma prova de conceito utilizando dados de um experimento de genômica funcional disponibilizado na plataforma ArrayExpress. A abordagem SSD2LOD Transformation Approach representa uma solução adequada para a transformação de dados de bioinformática em DAL, permitindo alcançar os benefícios da web semântica neste domínio.Data on the web are frequently stored in formats that hinder the automatic processing and extraction of knowledge. However, the transformation of those data into Linked Open Data (LOD) may facilitate the discovery of new knowledge. LOD defines a machinereadable, interconnected and semantically annotated dataset. The bioinformatics domain may benefit from the use of LOD, since it is characterized by the use and availability of large amounts of data on the web, usually stored in semi-structured text files. There are different approaches to support the transformation of structured and semi-structured data into LOD in the biomedical domain. However, these approaches are not easily applied to the bioinformatics domain. This work aimed at developing a transformation approach from semi-structured bioinformatics data into LOD, called SSD2LOD Transformation Approach. The proposed approach consists of four activities, which guide the definition of competency questions (questions of interest), specification of transformation rules, data transformation, and, finally, exploration of the produced LOD set. Additionally, we have developed a toolset to support the process of data transformation and exploration of our LOD transformation approach. Next, we have applied the proposed approach in a proof of concept using source data from a functional genomics experiment available at ArrayExpress. Our approach supports the transformation of bioinformatics data into LOD, thus enabling the benefits of the semantic web in this domain.Biblioteca Digitais de Teses e Dissertações da USPFarias, Clever Ricardo Guareis dePaula, Gabriel do Couto Seabra Gusmão de2019-11-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/59/59143/tde-21012020-225928/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2020-05-15T00:05:01Zoai:teses.usp.br:tde-21012020-225928Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212020-05-15T00:05:01Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Suporte à geração de dados abertos ligados em bioinformática Support for the generation of linked open data in bioinformatics |
title |
Suporte à geração de dados abertos ligados em bioinformática |
spellingShingle |
Suporte à geração de dados abertos ligados em bioinformática Paula, Gabriel do Couto Seabra Gusmão de Bioinformática Bioinformatics Dados abertos ligados Dados semiestruturados Linked open data Regras de transformação Semi-structured data Transformation rules |
title_short |
Suporte à geração de dados abertos ligados em bioinformática |
title_full |
Suporte à geração de dados abertos ligados em bioinformática |
title_fullStr |
Suporte à geração de dados abertos ligados em bioinformática |
title_full_unstemmed |
Suporte à geração de dados abertos ligados em bioinformática |
title_sort |
Suporte à geração de dados abertos ligados em bioinformática |
author |
Paula, Gabriel do Couto Seabra Gusmão de |
author_facet |
Paula, Gabriel do Couto Seabra Gusmão de |
author_role |
author |
dc.contributor.none.fl_str_mv |
Farias, Clever Ricardo Guareis de |
dc.contributor.author.fl_str_mv |
Paula, Gabriel do Couto Seabra Gusmão de |
dc.subject.por.fl_str_mv |
Bioinformática Bioinformatics Dados abertos ligados Dados semiestruturados Linked open data Regras de transformação Semi-structured data Transformation rules |
topic |
Bioinformática Bioinformatics Dados abertos ligados Dados semiestruturados Linked open data Regras de transformação Semi-structured data Transformation rules |
description |
Diferentes conjuntos de dados na web encontram-se em formatos que dificultam o processamento e a extração automática de informação. A transformação desses dados em Dados Abertos Ligados (DAL) pode facilitar o processamento e a obtenção de novos conhecimentos. DAL define um conjunto de dados compreendido/interpretável por computadores, interconectado e semanticamente anotado. Diversos domínios de conhecimento podem ser beneficiados com o uso de DAL, dentre os quais destaca-se a bioinformática. A bioinformática é caracterizada pelo uso e a disponibilização de grandes quantidades de dados na web, normalmente armazenados em arquivos texto semiestruturados. Existem diferentes abordagens de transformação de dados estruturados e semiestruturados para DAL no domínio biomédico. Porém, essas abordagens não podem ser facilmente estendidas para a bioinformática. Este trabalho teve por objetivo propor uma abordagem de transformação de dados semiestruturados de bioinformática para DAL, chamada de SSD2LOD Transformation Approach. Esta abordagem é composta por quatro atividades, as quais orientam a definição de questões de competência (perguntas de interesse), a especificação de regras de transformação, a transformação dos dados, e, finalmente, a exploração do conjunto DAL resultante. Adicionamente, desenvolvemos um conjunto de ferramentas de suporte para executar o processo de transformação e exploração dos dados, de modo a facilitar a aplicação da abordagem. Na sequência, aplicamos a abordagem proposta em uma prova de conceito utilizando dados de um experimento de genômica funcional disponibilizado na plataforma ArrayExpress. A abordagem SSD2LOD Transformation Approach representa uma solução adequada para a transformação de dados de bioinformática em DAL, permitindo alcançar os benefícios da web semântica neste domínio. |
publishDate |
2019 |
dc.date.none.fl_str_mv |
2019-11-20 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-21012020-225928/ |
url |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-21012020-225928/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090951383089152 |