Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem

Detalhes bibliográficos
Autor(a) principal: Gomes, Nicole Barbosa
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UNESP
Texto Completo: https://hdl.handle.net/11449/251470
Resumo: A linguagem é uma necessidade humana desde sua origem. Com métodos mais rudimentares ou mais rebuscados, o ser humano encontra maneiras de se comunicar. A partir do surgimento dos computadores e das mudanças proporcionadas por eles, um novo desafio também chegou: descobrir como gerar conversações com as máquinas. Os estudos a esse respeito levaram a invenções importantes que provocaram ideias antes consideradas impossíveis. A área de aprendizado de máquina foi responsável pela maior parte desses avanços e, graças ao ramo, modelos de redes neurais artificiais foram cada vez mais explorados. Como um dos resultados, os large language models, caracterizados por serem compostos por essas redes, apresentaram resultados admiráveis ao produzir textos muito parecidos com os escritos por humanos. O sucesso desses modelos despertou o interesse de empresas que passaram a desenvolver suas próprias versões. A partir disso, cresce a demanda por entender quais deles são mais apropriados para certas aplicações, e outras questões de desempenho. Com esse propósito, o projeto buscou desenvolver um site que pudesse reunir large language models a fim de que gerassem respostas baseadas em instruções do usuário. Além disso, a aplicação deveria ser capaz de receber feedbacks sobre o melhor texto para uma instrução específica e, dessa maneira, possibilitar análises dos dados coletados para descobrir os pontos fracos e fortes de cada modelo. No final do desenvolvimento, esses objetivos foram atingidos e o site se tornou uma ferramenta intuitiva, para atender a um grande público, e proveitosa para captura de informações relevantes e estudo dos retornos recebidos.
id UNSP_f0ad286aee7705c1897dd1fd6b7b37a4
oai_identifier_str oai:repositorio.unesp.br:11449/251470
network_acronym_str UNSP
network_name_str Repositório Institucional da UNESP
repository_id_str 2946
spelling Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagemDevelopment of an application for performance analysis of large language modelsProcessamento de linguagem naturalModelos de linguagemLarge language modelsInteligência artificialAprendizado de máquinaTransformersLarge language modelsArtificial intelligenceMachine learningA linguagem é uma necessidade humana desde sua origem. Com métodos mais rudimentares ou mais rebuscados, o ser humano encontra maneiras de se comunicar. A partir do surgimento dos computadores e das mudanças proporcionadas por eles, um novo desafio também chegou: descobrir como gerar conversações com as máquinas. Os estudos a esse respeito levaram a invenções importantes que provocaram ideias antes consideradas impossíveis. A área de aprendizado de máquina foi responsável pela maior parte desses avanços e, graças ao ramo, modelos de redes neurais artificiais foram cada vez mais explorados. Como um dos resultados, os large language models, caracterizados por serem compostos por essas redes, apresentaram resultados admiráveis ao produzir textos muito parecidos com os escritos por humanos. O sucesso desses modelos despertou o interesse de empresas que passaram a desenvolver suas próprias versões. A partir disso, cresce a demanda por entender quais deles são mais apropriados para certas aplicações, e outras questões de desempenho. Com esse propósito, o projeto buscou desenvolver um site que pudesse reunir large language models a fim de que gerassem respostas baseadas em instruções do usuário. Além disso, a aplicação deveria ser capaz de receber feedbacks sobre o melhor texto para uma instrução específica e, dessa maneira, possibilitar análises dos dados coletados para descobrir os pontos fracos e fortes de cada modelo. No final do desenvolvimento, esses objetivos foram atingidos e o site se tornou uma ferramenta intuitiva, para atender a um grande público, e proveitosa para captura de informações relevantes e estudo dos retornos recebidos.Language has been a human necessity since its origin. With methods ranging from rudimentary to more elaborate, humans have found ways to communicate. With the advent of computers and the changes they brought, a new challenge emerged: discovering how to engage in conversations with machines. Studies in this regard led to important inventions that sparked ideas once considered impossible. The field of machine learning has been responsible for most of these advances, and, thanks to this, artificial neural network models have been increasingly explored. As a result, large language models, characterized by being composed of these networks, have shown remarkable results in producing texts very similar to those written by humans. The success of these models has piqued the interest of companies that began to develop their own versions. From there, the demand has grown to understand which of these models are more suitable for specific applications and other performance-related questions. To address this, the project aimed to develop a website that could bring together large language models in order for them to generate responses based on user instructions. Additionally, the application should be capable of receiving feedback on the best text for a specific instruction, thereby enabling analysis of the collected data to discover the strengths and weaknesses of each model. By the end of development, these objectives were achieved, and the website became an intuitive tool to serve a wide audience, proving to be valuable for capturing relevant information and studying the received feedback.Universidade Estadual Paulista (Unesp)Papa, João Paulo [UNESP]Gomes, Nicole Barbosa2023-11-24T18:39:55Z2023-11-24T18:39:55Z2023-11-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfGOMES, Nicole Barbosa. Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem. 2023. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Estadual Paulista (Unesp), Bauru, 2023.https://hdl.handle.net/11449/251470porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UNESPinstname:Universidade Estadual Paulista (UNESP)instacron:UNESP2023-11-25T06:00:33Zoai:repositorio.unesp.br:11449/251470Repositório InstitucionalPUBhttp://repositorio.unesp.br/oai/requestopendoar:29462024-05-23T11:08:45.509112Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)false
dc.title.none.fl_str_mv Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
Development of an application for performance analysis of large language models
title Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
spellingShingle Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
Gomes, Nicole Barbosa
Processamento de linguagem natural
Modelos de linguagem
Large language models
Inteligência artificial
Aprendizado de máquina
Transformers
Large language models
Artificial intelligence
Machine learning
title_short Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
title_full Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
title_fullStr Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
title_full_unstemmed Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
title_sort Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem
author Gomes, Nicole Barbosa
author_facet Gomes, Nicole Barbosa
author_role author
dc.contributor.none.fl_str_mv Papa, João Paulo [UNESP]
dc.contributor.author.fl_str_mv Gomes, Nicole Barbosa
dc.subject.por.fl_str_mv Processamento de linguagem natural
Modelos de linguagem
Large language models
Inteligência artificial
Aprendizado de máquina
Transformers
Large language models
Artificial intelligence
Machine learning
topic Processamento de linguagem natural
Modelos de linguagem
Large language models
Inteligência artificial
Aprendizado de máquina
Transformers
Large language models
Artificial intelligence
Machine learning
description A linguagem é uma necessidade humana desde sua origem. Com métodos mais rudimentares ou mais rebuscados, o ser humano encontra maneiras de se comunicar. A partir do surgimento dos computadores e das mudanças proporcionadas por eles, um novo desafio também chegou: descobrir como gerar conversações com as máquinas. Os estudos a esse respeito levaram a invenções importantes que provocaram ideias antes consideradas impossíveis. A área de aprendizado de máquina foi responsável pela maior parte desses avanços e, graças ao ramo, modelos de redes neurais artificiais foram cada vez mais explorados. Como um dos resultados, os large language models, caracterizados por serem compostos por essas redes, apresentaram resultados admiráveis ao produzir textos muito parecidos com os escritos por humanos. O sucesso desses modelos despertou o interesse de empresas que passaram a desenvolver suas próprias versões. A partir disso, cresce a demanda por entender quais deles são mais apropriados para certas aplicações, e outras questões de desempenho. Com esse propósito, o projeto buscou desenvolver um site que pudesse reunir large language models a fim de que gerassem respostas baseadas em instruções do usuário. Além disso, a aplicação deveria ser capaz de receber feedbacks sobre o melhor texto para uma instrução específica e, dessa maneira, possibilitar análises dos dados coletados para descobrir os pontos fracos e fortes de cada modelo. No final do desenvolvimento, esses objetivos foram atingidos e o site se tornou uma ferramenta intuitiva, para atender a um grande público, e proveitosa para captura de informações relevantes e estudo dos retornos recebidos.
publishDate 2023
dc.date.none.fl_str_mv 2023-11-24T18:39:55Z
2023-11-24T18:39:55Z
2023-11-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv GOMES, Nicole Barbosa. Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem. 2023. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Estadual Paulista (Unesp), Bauru, 2023.
https://hdl.handle.net/11449/251470
identifier_str_mv GOMES, Nicole Barbosa. Desenvolvimento de uma aplicação para análise de desempenho de grandes modelos de linguagem. 2023. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Estadual Paulista (Unesp), Bauru, 2023.
url https://hdl.handle.net/11449/251470
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
publisher.none.fl_str_mv Universidade Estadual Paulista (Unesp)
dc.source.none.fl_str_mv reponame:Repositório Institucional da UNESP
instname:Universidade Estadual Paulista (UNESP)
instacron:UNESP
instname_str Universidade Estadual Paulista (UNESP)
instacron_str UNESP
institution UNESP
reponame_str Repositório Institucional da UNESP
collection Repositório Institucional da UNESP
repository.name.fl_str_mv Repositório Institucional da UNESP - Universidade Estadual Paulista (UNESP)
repository.mail.fl_str_mv
_version_ 1803045779584057344