Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA

Detalhes bibliográficos
Autor(a) principal: Silva, Wendson Carlos Souza da
Data de Publicação: 2023
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UFPB
Texto Completo: https://repositorio.ufpb.br/jspui/handle/123456789/31765
Resumo: Considerando a vasta quantidade de elementos midiáticos, dados desportivos e estatísticos de futebol, bem como das questões que envolvem a escassez de cobertura esportiva em eventos de menor abrangência, surge a necessidade de empregar estudos experimentais que se concentrem na automação da narração de partidas de futebol. Além disso, a imperativa demanda por aprimorar a acessibilidade cultural para indivíduos com deficiências, por meio da utilização de tecnologias emergentes, reforça a relevância deste domínio de pesquisa. Frente a isso, os Modelos de Linguagem de Larga Escala (LLMs) mostram-se relevantes por apresentarem resultados notáveis na geração de conteúdo. Dessa forma, pesquisa-se sobre o uso do Large Language Model Meta AI- LLaMA a fim compreender o desempenho desse sistema em conceber narrações desportivas a partir de eventos de jogos de futebol. Para tanto, é necessário conduzir experimentos, comparar e avaliar o sistema por parâmetros distintos, analisar a qualidade da narrativa em contexto de legibilidade textual e identificar padrões de comportamentos, falhas e virtudes do modelo. Procedeu se, então, uma pesquisa com metodologia exploratória, a qual se valeu das informações granulares, obtidas lance-a-lance, para estruturar as ocorrências em agrupamentos de eventos, sendo estes utilizados como comando de entrada para o LLaMA. As amostram também foram submetidas a estruturação em diferentes conjuntos buscando aferir a relevância da alteração dos parâmetros no modelo. Diante disso, verificou-se que o LLaMA apresentou resultados favoráveis relacionados a compreensão de leitura, principalmente no conjunto com parâmetros de temperatura de amostragem, top-k e top-p mais altos, contudo exibiram uma baixa taxa de acerto. O modelo também obteve resultados esperados no que diz respeito ao objetivo de possuir características relacionadas ao gênero narrativo que condiz com a personalidade de um comentarista esportivo. O incremento de informações, característico dos LLMs se mostrou como um fator preocupante e determinístico para avaliação dos erros no texto de saída. Essas informações evidenciam a capacidade do sistema em gerar narrações automatizadas de eventos esportivos, em bora revelem a presença de algumas limitações que demandam investigações adicionais e aprimoramentos por parte dos desenvolvedores.
id UFPB-2_bcd04efaed3f3131d090f63399ef1577
oai_identifier_str oai:repositorio.ufpb.br:123456789/31765
network_acronym_str UFPB-2
network_name_str Repositório Institucional da UFPB
repository_id_str 2546
spelling 2024-09-09T18:21:19Z2023-12-112024-09-09T18:21:19Z2023-11-14https://repositorio.ufpb.br/jspui/handle/123456789/31765Considerando a vasta quantidade de elementos midiáticos, dados desportivos e estatísticos de futebol, bem como das questões que envolvem a escassez de cobertura esportiva em eventos de menor abrangência, surge a necessidade de empregar estudos experimentais que se concentrem na automação da narração de partidas de futebol. Além disso, a imperativa demanda por aprimorar a acessibilidade cultural para indivíduos com deficiências, por meio da utilização de tecnologias emergentes, reforça a relevância deste domínio de pesquisa. Frente a isso, os Modelos de Linguagem de Larga Escala (LLMs) mostram-se relevantes por apresentarem resultados notáveis na geração de conteúdo. Dessa forma, pesquisa-se sobre o uso do Large Language Model Meta AI- LLaMA a fim compreender o desempenho desse sistema em conceber narrações desportivas a partir de eventos de jogos de futebol. Para tanto, é necessário conduzir experimentos, comparar e avaliar o sistema por parâmetros distintos, analisar a qualidade da narrativa em contexto de legibilidade textual e identificar padrões de comportamentos, falhas e virtudes do modelo. Procedeu se, então, uma pesquisa com metodologia exploratória, a qual se valeu das informações granulares, obtidas lance-a-lance, para estruturar as ocorrências em agrupamentos de eventos, sendo estes utilizados como comando de entrada para o LLaMA. As amostram também foram submetidas a estruturação em diferentes conjuntos buscando aferir a relevância da alteração dos parâmetros no modelo. Diante disso, verificou-se que o LLaMA apresentou resultados favoráveis relacionados a compreensão de leitura, principalmente no conjunto com parâmetros de temperatura de amostragem, top-k e top-p mais altos, contudo exibiram uma baixa taxa de acerto. O modelo também obteve resultados esperados no que diz respeito ao objetivo de possuir características relacionadas ao gênero narrativo que condiz com a personalidade de um comentarista esportivo. O incremento de informações, característico dos LLMs se mostrou como um fator preocupante e determinístico para avaliação dos erros no texto de saída. Essas informações evidenciam a capacidade do sistema em gerar narrações automatizadas de eventos esportivos, em bora revelem a presença de algumas limitações que demandam investigações adicionais e aprimoramentos por parte dos desenvolvedores.Considering the vast amount of media elements, sports data, and football statistics, as well as the issues surrounding the lack of sports coverage in less prominent events, there arises the need to employ experimental studies that focus on automating football match commentary. Additionally, the imperative demand to improve cultural accessibility for individuals with disabilities through the use of emerging technologies reinforces the re levance of this research domain. In this context, Large Language Models (LLMs) prove relevant for yielding remarkable results in content generation. Thus, research is conducted on the use of the Large Language Model Meta AI- LLaMA to understand the perfor mance of this system in crafting soccer commentary from football game events. To do so, it is necessary to conduct experiments, compare and evaluate the system using different parameters, analyze the quality of the commentary in the context of textual readabi lity, and identify patterns of behaviors, flaws, and virtues of the model. An exploratory research methodology was then employed, utilizing granular information obtained play by-play to structure occurrences into event clusters, which were used as input commands for LLaMA. The samples were also subjected to structuring in different sets, aiming to assess the relevance of parameter changes in the model. In this regard, it was obser ved that LLaMA showed favorable results related to reading comprehension, especially in the set with higher sampling temperature, top-k, and top-p parameters. However, they exhibited a low accuracy rate. The model also achieved expected results concerning the goal of possessing narrative genre characteristics that align with the personality of a sports commentator. The increase in information, characteristic of LLMs, proved to be a concerning and deterministic factor for evaluating errors in the output text. These f indings highlight the system’s ability to generate automated sports event commentary, although they reveal the presence of some limitations that require further investigation and improvements from developers.Submitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2024-09-09T18:21:19Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Wendson Carlos Souza da Silva_TCC.pdf: 1563373 bytes, checksum: b00d44a48a5a3dde7ebab021ec2354cb (MD5)Made available in DSpace on 2024-09-09T18:21:19Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Wendson Carlos Souza da Silva_TCC.pdf: 1563373 bytes, checksum: b00d44a48a5a3dde7ebab021ec2354cb (MD5) Previous issue date: 2023-11-14porUniversidade Federal da ParaíbaUFPBBrasilComputação CientíficaAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::OUTROSInteligência artificial ganerativaLLaMANarração esportivaLLMsAvaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMAinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisBarbosa, Yuri de Almeida Malheiros07146619451http://lattes.cnpq.br/639623509623621770523999464http://lattes.cnpq.br/0824392194868095Silva, Wendson Carlos Souza dareponame:Repositório Institucional da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPBTEXTWendson Carlos Souza da Silva_TCC.pdf.txtWendson Carlos Souza da Silva_TCC.pdf.txtExtracted texttext/plain91277https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/4/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdf.txt08b0657e0f5a8c128eef69dfd0493e92MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-82390https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/3/license.txte20ac18e101915e6935b82a641b985c0MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/2/license_rdfc4c98de35c20c53220c07884f4def27cMD52ORIGINALWendson Carlos Souza da Silva_TCC.pdfWendson Carlos Souza da Silva_TCC.pdfTCCapplication/pdf1563373https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/1/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdfb00d44a48a5a3dde7ebab021ec2354cbMD51123456789/317652024-09-10 03:05:44.123oai:repositorio.ufpb.br:123456789/31765QVVUT1JJWkHDh8ODTyBFIExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBdXRvcml6byBlIGVzdG91IGRlIGFjb3JkbywgbmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbyBhdXRvLWRlcG9zaXRhZGEsIGNvbmZvcm1lIExlaSBuwrogOTYxMC85OCwgb3Mgc2VndWludGVzIHRlcm1vczoKIApEYSBEaXN0cmlidWnDp8OjbyBuw6NvLWV4Y2x1c2l2YSAKTyBhdXRvciBkZWNsYXJhIHF1ZTogCmEpIE8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0ZSB0ZXJtby4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuIApiKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0ZSB0ZXJtbywgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IGNvbnRlw7pkbyBkbyB0cmFiYWxobyBlbnRyZWd1ZS4gCmMpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCmQpIENvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBvIGRpcmVpdG8gZGUgcmVwcm9kdXppciwgdHJhZHV6aXIsIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KZSkgVm9jw6ogY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgcHVibGljYcOnw6NvIHBhcmEgcXVhbHF1ZXIgbWVpbyBvdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLgpmKSBWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKRG9zIEVtYmFyZ29zIGUgUmVzdHJpw6fDtWVzIGRlIEFjZXNzbwpPIGVtYmFyZ28gcG9kZXLDoSBzZXIgbWFudGlkbyBwb3IgYXTDqSAxICh1bSkgYW5vLCBwb2RlbmRvIHNlciBwcm9ycm9nYWRvIHBvciBpZ3VhbCBwZXLDrW9kbywgY29tIGEgbmVjZXNzaWRhZGUgZGUgYW5leGFyIGRvY3VtZW50b3MgY29tcHJvYmF0w7NyaW9zLiBPIHJlc3VtbyBlIG9zIG1ldGFkYWRvcyBkZXNjcml0aXZvcyBzZXLDo28gZGlzcG9uaWJpbGl6YWRvcyBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCLgpPIGRlcMOzc2l0byBkbyB0cmFiYWxobyDDqSBvYnJpZ2F0w7NyaW8sIGluZGVwZW5kZW50ZSBkbyBlbWJhcmdvLgpRdWFuZG8gZW1iYXJnYWRvLCBvIHRyYWJhbGhvIHBlcm1hbmVjZXLDoSBpbmRpc3BvbsOtdmVsIGVucXVhbnRvIHZpZ29yYXIgYXMgcmVzdHJpw6fDtWVzLiBQYXNzYWRvIG8gcGVyw61vZG8gZG8gZW1iYXJnbywgbyB0cmFiYWxobyBzZXLDoSBhdXRvbWF0aWNhbWVudGUgZGlzcG9uaWJpbGl6YWRvIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEIuIAo=Repositório InstitucionalPUBhttps://repositorio.ufpb.br/oai/requestdiretoria@ufpb.bropendoar:25462024-09-10T06:05:44Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.pt_BR.fl_str_mv Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
spellingShingle Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
Silva, Wendson Carlos Souza da
CNPQ::OUTROS
Inteligência artificial ganerativa
LLaMA
Narração esportiva
LLMs
title_short Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_full Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_fullStr Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_full_unstemmed Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_sort Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
author Silva, Wendson Carlos Souza da
author_facet Silva, Wendson Carlos Souza da
author_role author
dc.contributor.advisor1.fl_str_mv Barbosa, Yuri de Almeida Malheiros
dc.contributor.advisor1ID.fl_str_mv 07146619451
dc.contributor.advisor1Lattes.fl_str_mv http://lattes.cnpq.br/6396235096236217
dc.contributor.authorID.fl_str_mv 70523999464
dc.contributor.authorLattes.fl_str_mv http://lattes.cnpq.br/0824392194868095
dc.contributor.author.fl_str_mv Silva, Wendson Carlos Souza da
contributor_str_mv Barbosa, Yuri de Almeida Malheiros
dc.subject.cnpq.fl_str_mv CNPQ::OUTROS
topic CNPQ::OUTROS
Inteligência artificial ganerativa
LLaMA
Narração esportiva
LLMs
dc.subject.por.fl_str_mv Inteligência artificial ganerativa
LLaMA
Narração esportiva
LLMs
description Considerando a vasta quantidade de elementos midiáticos, dados desportivos e estatísticos de futebol, bem como das questões que envolvem a escassez de cobertura esportiva em eventos de menor abrangência, surge a necessidade de empregar estudos experimentais que se concentrem na automação da narração de partidas de futebol. Além disso, a imperativa demanda por aprimorar a acessibilidade cultural para indivíduos com deficiências, por meio da utilização de tecnologias emergentes, reforça a relevância deste domínio de pesquisa. Frente a isso, os Modelos de Linguagem de Larga Escala (LLMs) mostram-se relevantes por apresentarem resultados notáveis na geração de conteúdo. Dessa forma, pesquisa-se sobre o uso do Large Language Model Meta AI- LLaMA a fim compreender o desempenho desse sistema em conceber narrações desportivas a partir de eventos de jogos de futebol. Para tanto, é necessário conduzir experimentos, comparar e avaliar o sistema por parâmetros distintos, analisar a qualidade da narrativa em contexto de legibilidade textual e identificar padrões de comportamentos, falhas e virtudes do modelo. Procedeu se, então, uma pesquisa com metodologia exploratória, a qual se valeu das informações granulares, obtidas lance-a-lance, para estruturar as ocorrências em agrupamentos de eventos, sendo estes utilizados como comando de entrada para o LLaMA. As amostram também foram submetidas a estruturação em diferentes conjuntos buscando aferir a relevância da alteração dos parâmetros no modelo. Diante disso, verificou-se que o LLaMA apresentou resultados favoráveis relacionados a compreensão de leitura, principalmente no conjunto com parâmetros de temperatura de amostragem, top-k e top-p mais altos, contudo exibiram uma baixa taxa de acerto. O modelo também obteve resultados esperados no que diz respeito ao objetivo de possuir características relacionadas ao gênero narrativo que condiz com a personalidade de um comentarista esportivo. O incremento de informações, característico dos LLMs se mostrou como um fator preocupante e determinístico para avaliação dos erros no texto de saída. Essas informações evidenciam a capacidade do sistema em gerar narrações automatizadas de eventos esportivos, em bora revelem a presença de algumas limitações que demandam investigações adicionais e aprimoramentos por parte dos desenvolvedores.
publishDate 2023
dc.date.available.fl_str_mv 2023-12-11
2024-09-09T18:21:19Z
dc.date.issued.fl_str_mv 2023-11-14
dc.date.accessioned.fl_str_mv 2024-09-09T18:21:19Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://repositorio.ufpb.br/jspui/handle/123456789/31765
url https://repositorio.ufpb.br/jspui/handle/123456789/31765
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Universidade Federal da Paraíba
dc.publisher.initials.fl_str_mv UFPB
dc.publisher.country.fl_str_mv Brasil
dc.publisher.department.fl_str_mv Computação Científica
publisher.none.fl_str_mv Universidade Federal da Paraíba
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPB
instname:Universidade Federal da Paraíba (UFPB)
instacron:UFPB
instname_str Universidade Federal da Paraíba (UFPB)
instacron_str UFPB
institution UFPB
reponame_str Repositório Institucional da UFPB
collection Repositório Institucional da UFPB
bitstream.url.fl_str_mv https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/4/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdf.txt
https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/3/license.txt
https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/2/license_rdf
https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/1/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdf
bitstream.checksum.fl_str_mv 08b0657e0f5a8c128eef69dfd0493e92
e20ac18e101915e6935b82a641b985c0
c4c98de35c20c53220c07884f4def27c
b00d44a48a5a3dde7ebab021ec2354cb
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv diretoria@ufpb.br
_version_ 1815449124620730368