Analyzing natural language inference from a rigorous point of view
Autor(a) principal: | |
---|---|
Data de Publicação: | 2020 |
Tipo de documento: | Tese |
Idioma: | eng |
Título da fonte: | Biblioteca Digital de Teses e Dissertações da USP |
Texto Completo: | https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05012021-151600/ |
Resumo: | Natural language inference (NLI) is the task of determining the entailment relationship between a pair of sentences. We are interested in the problem of verifying whether the deep learning models current used in NLI satisfy some logical properties. In this thesis, we focus on two properties: i) the capacity of solving deduction problems based on some specific logical forms (e.g., Boolean coordination, quantifiers, definite description, and counting operators); and ii) the property of having the same conclusion from equivalent premises. For each one of these properties we develop a new evaluation procedure. For i) we offer a new synthetic dataset that can be used both for inference perception and inference generation; and for ii) we propose a null hypothesis test constructed to represent the different manners that the inclusion of sentences with the same meaning can affect the training of a machine learning model. Our results show that although deep learning models have an outstanding performance on the majority of NLI datasets, they still lack some important inference skills such as dealing with counting operators, predicting which word can form an entailment given an specific context, and presenting the same deductions for two different text inputs with the same meaning. This indicates that despite the high prediction power of these new models, they do present some inference biases that cannot be easily removed. Future investigations are needed in order to understand the scope of this bias. It is possible that by increasing the training sample size in the fine-tuning phase, this bias can be reduced. |
id |
USP_c3dae0c2e03bf79a625e847237d57436 |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-05012021-151600 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Analyzing natural language inference from a rigorous point of viewAnalisando Inferência em Linguagem Natural de um Ponto de Vista RigorosoBias in deep learningClassificação de textoInferência em linguagem naturalNatural language inferenceNatural language processingProcessamento de linguagem naturalText classificationVíes em modelos de aprendizado de máquinaNatural language inference (NLI) is the task of determining the entailment relationship between a pair of sentences. We are interested in the problem of verifying whether the deep learning models current used in NLI satisfy some logical properties. In this thesis, we focus on two properties: i) the capacity of solving deduction problems based on some specific logical forms (e.g., Boolean coordination, quantifiers, definite description, and counting operators); and ii) the property of having the same conclusion from equivalent premises. For each one of these properties we develop a new evaluation procedure. For i) we offer a new synthetic dataset that can be used both for inference perception and inference generation; and for ii) we propose a null hypothesis test constructed to represent the different manners that the inclusion of sentences with the same meaning can affect the training of a machine learning model. Our results show that although deep learning models have an outstanding performance on the majority of NLI datasets, they still lack some important inference skills such as dealing with counting operators, predicting which word can form an entailment given an specific context, and presenting the same deductions for two different text inputs with the same meaning. This indicates that despite the high prediction power of these new models, they do present some inference biases that cannot be easily removed. Future investigations are needed in order to understand the scope of this bias. It is possible that by increasing the training sample size in the fine-tuning phase, this bias can be reduced.Inferência em linguagem natural (natural language inference - NLI) é uma tarefa de classificação de texto baseada em determinar a relação de implicação entre um par de sentenças. Nessa tese estamos interessados em verificar se os modelos de deep learning usados em NLI satisfazem algumas propriedades lógicas. Aqui, focamos em duas propriedades: i) a capacidade de resolver problemas de dedução usando algumas formas lógicas (por exemplo, coordenação Booleana, quantificadores, descrição definida e operadores de contagem); e ii) a propriedade de ter a mesma conclusão partindo de premissas equivalentes. Para cada uma dessas propriedades, desenvolvemos um novo procedimento de avaliação. Para i) oferecemos um novo conjunto de dados sintético que podem ser usados tanto para a classificação quanto para a geração de inferência; e para ii) propomos um teste de hipóteses construído para representar as diferentes maneiras que a inclusão de sentenças com o mesmo significado pode afetar o treinamento de um modelo de aprendizado de máquina. Nossos resultados mostram que, embora os modelos de deep learning tenham um desempenho excelente na maioria dos problemas de NLI, eles ainda carecem de algumas importantes habilidades de inferência, como lidar com operadores de contagem, prever qual palavra pode formar uma implicação em um contexto específico e apresentar as mesmas deduções para duas entradas de texto que são diferentes mas possuem o mesmo significado. Isso indica que, apesar do grande poder de predição desses novos modelos, eles apresentam alguns viéses de inferência que não podem ser facilmente removidos. Futuras investigações precisam ser feitas para se entender o alcance desse víes. É possível que aumentando o tamanho da amostra de treinamento na fase de fine-tuning esse viés seja reduzido.Biblioteca Digitais de Teses e Dissertações da USPFinger, MarceloHirata Junior, RobertoSalvatore, Felipe de Souza2020-12-14info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/45/45134/tde-05012021-151600/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesseng2021-01-22T15:04:39Zoai:teses.usp.br:tde-05012021-151600Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212021-01-22T15:04:39Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Analyzing natural language inference from a rigorous point of view Analisando Inferência em Linguagem Natural de um Ponto de Vista Rigoroso |
title |
Analyzing natural language inference from a rigorous point of view |
spellingShingle |
Analyzing natural language inference from a rigorous point of view Salvatore, Felipe de Souza Bias in deep learning Classificação de texto Inferência em linguagem natural Natural language inference Natural language processing Processamento de linguagem natural Text classification Víes em modelos de aprendizado de máquina |
title_short |
Analyzing natural language inference from a rigorous point of view |
title_full |
Analyzing natural language inference from a rigorous point of view |
title_fullStr |
Analyzing natural language inference from a rigorous point of view |
title_full_unstemmed |
Analyzing natural language inference from a rigorous point of view |
title_sort |
Analyzing natural language inference from a rigorous point of view |
author |
Salvatore, Felipe de Souza |
author_facet |
Salvatore, Felipe de Souza |
author_role |
author |
dc.contributor.none.fl_str_mv |
Finger, Marcelo Hirata Junior, Roberto |
dc.contributor.author.fl_str_mv |
Salvatore, Felipe de Souza |
dc.subject.por.fl_str_mv |
Bias in deep learning Classificação de texto Inferência em linguagem natural Natural language inference Natural language processing Processamento de linguagem natural Text classification Víes em modelos de aprendizado de máquina |
topic |
Bias in deep learning Classificação de texto Inferência em linguagem natural Natural language inference Natural language processing Processamento de linguagem natural Text classification Víes em modelos de aprendizado de máquina |
description |
Natural language inference (NLI) is the task of determining the entailment relationship between a pair of sentences. We are interested in the problem of verifying whether the deep learning models current used in NLI satisfy some logical properties. In this thesis, we focus on two properties: i) the capacity of solving deduction problems based on some specific logical forms (e.g., Boolean coordination, quantifiers, definite description, and counting operators); and ii) the property of having the same conclusion from equivalent premises. For each one of these properties we develop a new evaluation procedure. For i) we offer a new synthetic dataset that can be used both for inference perception and inference generation; and for ii) we propose a null hypothesis test constructed to represent the different manners that the inclusion of sentences with the same meaning can affect the training of a machine learning model. Our results show that although deep learning models have an outstanding performance on the majority of NLI datasets, they still lack some important inference skills such as dealing with counting operators, predicting which word can form an entailment given an specific context, and presenting the same deductions for two different text inputs with the same meaning. This indicates that despite the high prediction power of these new models, they do present some inference biases that cannot be easily removed. Future investigations are needed in order to understand the scope of this bias. It is possible that by increasing the training sample size in the fine-tuning phase, this bias can be reduced. |
publishDate |
2020 |
dc.date.none.fl_str_mv |
2020-12-14 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05012021-151600/ |
url |
https://www.teses.usp.br/teses/disponiveis/45/45134/tde-05012021-151600/ |
dc.language.iso.fl_str_mv |
eng |
language |
eng |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1809090395645149184 |