Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA

Silva, Wendson Carlos Souza da

Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA

Detalhes bibliográficos
Autor(a) principal:	Silva, Wendson Carlos Souza da
Data de Publicação:	2023
Tipo de documento:	Trabalho de conclusão de curso
Idioma:	por
Título da fonte:	Repositório Institucional da UFPB
Texto Completo:	https://repositorio.ufpb.br/jspui/handle/123456789/31765
Resumo:	Considerando a vasta quantidade de elementos midiáticos, dados desportivos e estatísticos de futebol, bem como das questões que envolvem a escassez de cobertura esportiva em eventos de menor abrangência, surge a necessidade de empregar estudos experimentais que se concentrem na automação da narração de partidas de futebol. Além disso, a imperativa demanda por aprimorar a acessibilidade cultural para indivíduos com deficiências, por meio da utilização de tecnologias emergentes, reforça a relevância deste domínio de pesquisa. Frente a isso, os Modelos de Linguagem de Larga Escala (LLMs) mostram-se relevantes por apresentarem resultados notáveis na geração de conteúdo. Dessa forma, pesquisa-se sobre o uso do Large Language Model Meta AI- LLaMA a fim compreender o desempenho desse sistema em conceber narrações desportivas a partir de eventos de jogos de futebol. Para tanto, é necessário conduzir experimentos, comparar e avaliar o sistema por parâmetros distintos, analisar a qualidade da narrativa em contexto de legibilidade textual e identificar padrões de comportamentos, falhas e virtudes do modelo. Procedeu se, então, uma pesquisa com metodologia exploratória, a qual se valeu das informações granulares, obtidas lance-a-lance, para estruturar as ocorrências em agrupamentos de eventos, sendo estes utilizados como comando de entrada para o LLaMA. As amostram também foram submetidas a estruturação em diferentes conjuntos buscando aferir a relevância da alteração dos parâmetros no modelo. Diante disso, verificou-se que o LLaMA apresentou resultados favoráveis relacionados a compreensão de leitura, principalmente no conjunto com parâmetros de temperatura de amostragem, top-k e top-p mais altos, contudo exibiram uma baixa taxa de acerto. O modelo também obteve resultados esperados no que diz respeito ao objetivo de possuir características relacionadas ao gênero narrativo que condiz com a personalidade de um comentarista esportivo. O incremento de informações, característico dos LLMs se mostrou como um fator preocupante e determinístico para avaliação dos erros no texto de saída. Essas informações evidenciam a capacidade do sistema em gerar narrações automatizadas de eventos esportivos, em bora revelem a presença de algumas limitações que demandam investigações adicionais e aprimoramentos por parte dos desenvolvedores.

Metadados do item

id	UFPB-2_bcd04efaed3f3131d090f63399ef1577
oai_identifier_str	oai:repositorio.ufpb.br:123456789/31765
network_acronym_str	UFPB-2
network_name_str	Repositório Institucional da UFPB
repository_id_str	2546
spelling	2024-09-09T18:21:19Z2023-12-112024-09-09T18:21:19Z2023-11-14https://repositorio.ufpb.br/jspui/handle/123456789/31765Considerando a vasta quantidade de elementos midiáticos, dados desportivos e estatísticos de futebol, bem como das questões que envolvem a escassez de cobertura esportiva em eventos de menor abrangência, surge a necessidade de empregar estudos experimentais que se concentrem na automação da narração de partidas de futebol. Além disso, a imperativa demanda por aprimorar a acessibilidade cultural para indivíduos com deficiências, por meio da utilização de tecnologias emergentes, reforça a relevância deste domínio de pesquisa. Frente a isso, os Modelos de Linguagem de Larga Escala (LLMs) mostram-se relevantes por apresentarem resultados notáveis na geração de conteúdo. Dessa forma, pesquisa-se sobre o uso do Large Language Model Meta AI- LLaMA a fim compreender o desempenho desse sistema em conceber narrações desportivas a partir de eventos de jogos de futebol. Para tanto, é necessário conduzir experimentos, comparar e avaliar o sistema por parâmetros distintos, analisar a qualidade da narrativa em contexto de legibilidade textual e identificar padrões de comportamentos, falhas e virtudes do modelo. Procedeu se, então, uma pesquisa com metodologia exploratória, a qual se valeu das informações granulares, obtidas lance-a-lance, para estruturar as ocorrências em agrupamentos de eventos, sendo estes utilizados como comando de entrada para o LLaMA. As amostram também foram submetidas a estruturação em diferentes conjuntos buscando aferir a relevância da alteração dos parâmetros no modelo. Diante disso, verificou-se que o LLaMA apresentou resultados favoráveis relacionados a compreensão de leitura, principalmente no conjunto com parâmetros de temperatura de amostragem, top-k e top-p mais altos, contudo exibiram uma baixa taxa de acerto. O modelo também obteve resultados esperados no que diz respeito ao objetivo de possuir características relacionadas ao gênero narrativo que condiz com a personalidade de um comentarista esportivo. O incremento de informações, característico dos LLMs se mostrou como um fator preocupante e determinístico para avaliação dos erros no texto de saída. Essas informações evidenciam a capacidade do sistema em gerar narrações automatizadas de eventos esportivos, em bora revelem a presença de algumas limitações que demandam investigações adicionais e aprimoramentos por parte dos desenvolvedores.Considering the vast amount of media elements, sports data, and football statistics, as well as the issues surrounding the lack of sports coverage in less prominent events, there arises the need to employ experimental studies that focus on automating football match commentary. Additionally, the imperative demand to improve cultural accessibility for individuals with disabilities through the use of emerging technologies reinforces the re levance of this research domain. In this context, Large Language Models (LLMs) prove relevant for yielding remarkable results in content generation. Thus, research is conducted on the use of the Large Language Model Meta AI- LLaMA to understand the perfor mance of this system in crafting soccer commentary from football game events. To do so, it is necessary to conduct experiments, compare and evaluate the system using different parameters, analyze the quality of the commentary in the context of textual readabi lity, and identify patterns of behaviors, flaws, and virtues of the model. An exploratory research methodology was then employed, utilizing granular information obtained play by-play to structure occurrences into event clusters, which were used as input commands for LLaMA. The samples were also subjected to structuring in different sets, aiming to assess the relevance of parameter changes in the model. In this regard, it was obser ved that LLaMA showed favorable results related to reading comprehension, especially in the set with higher sampling temperature, top-k, and top-p parameters. However, they exhibited a low accuracy rate. The model also achieved expected results concerning the goal of possessing narrative genre characteristics that align with the personality of a sports commentator. The increase in information, characteristic of LLMs, proved to be a concerning and deterministic factor for evaluating errors in the output text. These f indings highlight the system’s ability to generate automated sports event commentary, although they reveal the presence of some limitations that require further investigation and improvements from developers.Submitted by Michelle Barbosa (mi.2020@outlook.com.br) on 2024-09-09T18:21:19Z No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Wendson Carlos Souza da Silva_TCC.pdf: 1563373 bytes, checksum: b00d44a48a5a3dde7ebab021ec2354cb (MD5)Made available in DSpace on 2024-09-09T18:21:19Z (GMT). No. of bitstreams: 2 license_rdf: 805 bytes, checksum: c4c98de35c20c53220c07884f4def27c (MD5) Wendson Carlos Souza da Silva_TCC.pdf: 1563373 bytes, checksum: b00d44a48a5a3dde7ebab021ec2354cb (MD5) Previous issue date: 2023-11-14porUniversidade Federal da ParaíbaUFPBBrasilComputação CientíficaAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessCNPQ::OUTROSInteligência artificial ganerativaLLaMANarração esportivaLLMsAvaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMAinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisBarbosa, Yuri de Almeida Malheiros07146619451http://lattes.cnpq.br/639623509623621770523999464http://lattes.cnpq.br/0824392194868095Silva, Wendson Carlos Souza dareponame:Repositório Institucional da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPBTEXTWendson Carlos Souza da Silva_TCC.pdf.txtWendson Carlos Souza da Silva_TCC.pdf.txtExtracted texttext/plain91277https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/4/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdf.txt08b0657e0f5a8c128eef69dfd0493e92MD54LICENSElicense.txtlicense.txttext/plain; charset=utf-82390https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/3/license.txte20ac18e101915e6935b82a641b985c0MD53CC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8805https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/2/license_rdfc4c98de35c20c53220c07884f4def27cMD52ORIGINALWendson Carlos Souza da Silva_TCC.pdfWendson Carlos Souza da Silva_TCC.pdfTCCapplication/pdf1563373https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/1/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdfb00d44a48a5a3dde7ebab021ec2354cbMD51123456789/317652024-09-10 03:05:44.123oai:repositorio.ufpb.br:123456789/31765QVVUT1JJWkHDh8ODTyBFIExJQ0VOw4dBIERFIERJU1RSSUJVScOHw4NPIE7Dg08tRVhDTFVTSVZBCgpBdXRvcml6byBlIGVzdG91IGRlIGFjb3JkbywgbmEgcXVhbGlkYWRlIGRlIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGRlIGF1dG9yIGRhIHB1YmxpY2HDp8OjbyBhdXRvLWRlcG9zaXRhZGEsIGNvbmZvcm1lIExlaSBuwrogOTYxMC85OCwgb3Mgc2VndWludGVzIHRlcm1vczoKIApEYSBEaXN0cmlidWnDp8OjbyBuw6NvLWV4Y2x1c2l2YSAKTyBhdXRvciBkZWNsYXJhIHF1ZTogCmEpIE8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUgZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0ZSB0ZXJtby4gRGVjbGFyYSB0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kgcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuIApiKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MgZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcyBkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgb3MgZGlyZWl0b3MgcmVxdWVyaWRvcyBwb3IgZXN0ZSB0ZXJtbywgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlIHRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91IGNvbnRlw7pkbyBkbyB0cmFiYWxobyBlbnRyZWd1ZS4gCmMpIFNlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIGJhc2VhZG8gZW0gdHJhYmFsaG8gZmluYW5jaWFkbyBvdSBhcG9pYWRvIHBvciBvdXRyYSBpbnN0aXR1acOnw6NvIHF1ZSBuw6NvIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGEgUGFyYcOtYmEgZGVjbGFyYSBxdWUgY3VtcHJpdSBxdWFpc3F1ZXIgb2JyaWdhw6fDtWVzIGV4aWdpZGFzIHBlbG8gcmVzcGVjdGl2byBjb250cmF0byBvdSBhY29yZG8uCmQpIENvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvciAoZXMpIG91IG8gdGl0dWxhciBkb3MgZGlyZWl0b3MgZGUgYXV0b3IpIGNvbmNlZGUgYW8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBvIGRpcmVpdG8gZGUgcmVwcm9kdXppciwgdHJhZHV6aXIsIGUvb3UgZGlzdHJpYnVpciBhIHN1YSBwdWJsaWNhw6fDo28gKGluY2x1aW5kbyBvIHJlc3VtbykgcG9yIHRvZG8gbyBtdW5kbyBubyBmb3JtYXRvIGltcHJlc3NvIGUgZWxldHLDtG5pY28gZSBlbSBxdWFscXVlciBtZWlvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KZSkgVm9jw6ogY29uY29yZGEgcXVlIG8gUmVwb3NpdMOzcmlvIEluc3RpdHVjaW9uYWwgZGEgVUZQQiBwb2RlLCBzZW0gYWx0ZXJhciBvIGNvbnRlw7pkbywgdHJhbnNwb3IgYSBzdWEgcHVibGljYcOnw6NvIHBhcmEgcXVhbHF1ZXIgbWVpbyBvdSBmb3JtYXRvIHBhcmEgZmlucyBkZSBwcmVzZXJ2YcOnw6NvLgpmKSBWb2PDqiBjb25jb3JkYSBxdWUgbyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCIHBvZGUgbWFudGVyIG1haXMgZGUgdW1hIGPDs3BpYSBkZSBzdWEgcHVibGljYcOnw6NvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrdXAgZSBwcmVzZXJ2YcOnw6NvLgoKRG9zIEVtYmFyZ29zIGUgUmVzdHJpw6fDtWVzIGRlIEFjZXNzbwpPIGVtYmFyZ28gcG9kZXLDoSBzZXIgbWFudGlkbyBwb3IgYXTDqSAxICh1bSkgYW5vLCBwb2RlbmRvIHNlciBwcm9ycm9nYWRvIHBvciBpZ3VhbCBwZXLDrW9kbywgY29tIGEgbmVjZXNzaWRhZGUgZGUgYW5leGFyIGRvY3VtZW50b3MgY29tcHJvYmF0w7NyaW9zLiBPIHJlc3VtbyBlIG9zIG1ldGFkYWRvcyBkZXNjcml0aXZvcyBzZXLDo28gZGlzcG9uaWJpbGl6YWRvcyBubyBSZXBvc2l0w7NyaW8gSW5zdGl0dWNpb25hbCBkYSBVRlBCLgpPIGRlcMOzc2l0byBkbyB0cmFiYWxobyDDqSBvYnJpZ2F0w7NyaW8sIGluZGVwZW5kZW50ZSBkbyBlbWJhcmdvLgpRdWFuZG8gZW1iYXJnYWRvLCBvIHRyYWJhbGhvIHBlcm1hbmVjZXLDoSBpbmRpc3BvbsOtdmVsIGVucXVhbnRvIHZpZ29yYXIgYXMgcmVzdHJpw6fDtWVzLiBQYXNzYWRvIG8gcGVyw61vZG8gZG8gZW1iYXJnbywgbyB0cmFiYWxobyBzZXLDoSBhdXRvbWF0aWNhbWVudGUgZGlzcG9uaWJpbGl6YWRvIG5vIFJlcG9zaXTDs3JpbyBJbnN0aXR1Y2lvbmFsIGRhIFVGUEIuIAo=Repositório InstitucionalPUBhttps://repositorio.ufpb.br/oai/requestdiretoria@ufpb.bropendoar:25462024-09-10T06:05:44Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)false
dc.title.pt_BR.fl_str_mv	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
spellingShingle	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA Silva, Wendson Carlos Souza da CNPQ::OUTROS Inteligência artificial ganerativa LLaMA Narração esportiva LLMs
title_short	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_full	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_fullStr	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_full_unstemmed	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
title_sort	Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA
author	Silva, Wendson Carlos Souza da
author_facet	Silva, Wendson Carlos Souza da
author_role	author
dc.contributor.advisor1.fl_str_mv	Barbosa, Yuri de Almeida Malheiros
dc.contributor.advisor1ID.fl_str_mv	07146619451
dc.contributor.advisor1Lattes.fl_str_mv	http://lattes.cnpq.br/6396235096236217
dc.contributor.authorID.fl_str_mv	70523999464
dc.contributor.authorLattes.fl_str_mv	http://lattes.cnpq.br/0824392194868095
dc.contributor.author.fl_str_mv	Silva, Wendson Carlos Souza da
contributor_str_mv	Barbosa, Yuri de Almeida Malheiros
dc.subject.cnpq.fl_str_mv	CNPQ::OUTROS
topic	CNPQ::OUTROS Inteligência artificial ganerativa LLaMA Narração esportiva LLMs
dc.subject.por.fl_str_mv	Inteligência artificial ganerativa LLaMA Narração esportiva LLMs
description	Considerando a vasta quantidade de elementos midiáticos, dados desportivos e estatísticos de futebol, bem como das questões que envolvem a escassez de cobertura esportiva em eventos de menor abrangência, surge a necessidade de empregar estudos experimentais que se concentrem na automação da narração de partidas de futebol. Além disso, a imperativa demanda por aprimorar a acessibilidade cultural para indivíduos com deficiências, por meio da utilização de tecnologias emergentes, reforça a relevância deste domínio de pesquisa. Frente a isso, os Modelos de Linguagem de Larga Escala (LLMs) mostram-se relevantes por apresentarem resultados notáveis na geração de conteúdo. Dessa forma, pesquisa-se sobre o uso do Large Language Model Meta AI- LLaMA a fim compreender o desempenho desse sistema em conceber narrações desportivas a partir de eventos de jogos de futebol. Para tanto, é necessário conduzir experimentos, comparar e avaliar o sistema por parâmetros distintos, analisar a qualidade da narrativa em contexto de legibilidade textual e identificar padrões de comportamentos, falhas e virtudes do modelo. Procedeu se, então, uma pesquisa com metodologia exploratória, a qual se valeu das informações granulares, obtidas lance-a-lance, para estruturar as ocorrências em agrupamentos de eventos, sendo estes utilizados como comando de entrada para o LLaMA. As amostram também foram submetidas a estruturação em diferentes conjuntos buscando aferir a relevância da alteração dos parâmetros no modelo. Diante disso, verificou-se que o LLaMA apresentou resultados favoráveis relacionados a compreensão de leitura, principalmente no conjunto com parâmetros de temperatura de amostragem, top-k e top-p mais altos, contudo exibiram uma baixa taxa de acerto. O modelo também obteve resultados esperados no que diz respeito ao objetivo de possuir características relacionadas ao gênero narrativo que condiz com a personalidade de um comentarista esportivo. O incremento de informações, característico dos LLMs se mostrou como um fator preocupante e determinístico para avaliação dos erros no texto de saída. Essas informações evidenciam a capacidade do sistema em gerar narrações automatizadas de eventos esportivos, em bora revelem a presença de algumas limitações que demandam investigações adicionais e aprimoramentos por parte dos desenvolvedores.
publishDate	2023
dc.date.available.fl_str_mv	2023-12-11 2024-09-09T18:21:19Z
dc.date.issued.fl_str_mv	2023-11-14
dc.date.accessioned.fl_str_mv	2024-09-09T18:21:19Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://repositorio.ufpb.br/jspui/handle/123456789/31765
url	https://repositorio.ufpb.br/jspui/handle/123456789/31765
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/
eu_rights_str_mv	openAccess
dc.publisher.none.fl_str_mv	Universidade Federal da Paraíba
dc.publisher.initials.fl_str_mv	UFPB
dc.publisher.country.fl_str_mv	Brasil
dc.publisher.department.fl_str_mv	Computação Científica
publisher.none.fl_str_mv	Universidade Federal da Paraíba
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB
instname_str	Universidade Federal da Paraíba (UFPB)
instacron_str	UFPB
institution	UFPB
reponame_str	Repositório Institucional da UFPB
collection	Repositório Institucional da UFPB
bitstream.url.fl_str_mv	https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/4/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdf.txt https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/3/license.txt https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/2/license_rdf https://repositorio.ufpb.br/jspui/bitstream/123456789/31765/1/Wendson%20Carlos%20Souza%20da%20Silva_TCC.pdf
bitstream.checksum.fl_str_mv	08b0657e0f5a8c128eef69dfd0493e92 e20ac18e101915e6935b82a641b985c0 c4c98de35c20c53220c07884f4def27c b00d44a48a5a3dde7ebab021ec2354cb
bitstream.checksumAlgorithm.fl_str_mv	MD5 MD5 MD5 MD5
repository.name.fl_str_mv	Repositório Institucional da UFPB - Universidade Federal da Paraíba (UFPB)
repository.mail.fl_str_mv	diretoria@ufpb.br
_version_	1815449124620730368

Avaliação da Geração Automatizada de Narrações Esportivas com o Modelo de Linguagem LLaMA

Registros relacionados