Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa

Detalhes bibliográficos
Autor(a) principal: Nascimento, Pedro Miguel Delgado do
Data de Publicação: 2023
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
Texto Completo: http://hdl.handle.net/10071/31035
Resumo: A transcrição de debates parlamentares é essencial para a transparência, a responsabilidade e a acessibilidade da governação democrática. Tradicionalmente, esta tarefa é manual, morosa e depende de pessoas especializadas nessas tarefas. Este trabalho descreve o estudo, desenho e implementação de um sistema de transcrição para processamento automático dos debates parlamentares na Assembleia da República de Portugal, através de uma solução inovadora que utiliza tecnologias avançadas de reconhecimento automático de fala e de reconhecimento de mudança de orador. O Sistema de Transcrição Automática (STAAR) foi desenvolvido após uma análise das tecnologias existentes e das necessidades específicas da Assembleia da República e resultou numa solução que se integra eficazmente com os processos existentes e prevê a evolução contínua da tecnologia. O sistema revelou-se de grande valor, não só pela sua eficácia e rapidez na transcrição de debates parlamentares, mas também pela sua capacidade em adaptar-se à linguagem parlamentar e ao jargão específico. As conclusões deste trabalho revelam que o STAAR superou as expectativas ao apresentar uma taxa de erro bastante baixa, ao reduzir o tempo necessário para a produção do primeiro rascunho do Diário da AR e ao permitir a transcrição de reuniões de comissões parlamentares que anteriormente não eram documentadas, aumentando a abrangência e detalhe na documentação das atividades parlamentares. Este avanço representa um passo significativo na modernização dos processos parlamentares, na promoção de maior transparência e acessibilidade das informações políticas e posiciona a Assembleia da República de Portugal na vanguarda da inovação tecnológica, no contexto da transcrição de debates parlamentares.
id RCAP_ded70ccc16e813c12e743f210a8c88c8
oai_identifier_str oai:repositorio.iscte-iul.pt:10071/31035
network_acronym_str RCAP
network_name_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository_id_str 7160
spelling Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República PortuguesaTranscrição automáticaDebates parlamentaresReconhecimento de falaProcessamento de linguagem natural - -- NLP Natural language processingMachine learningDiarização de oradorAutomatic transcriptionParliamentary debatesSpeech recognitionSpeaker diarizationA transcrição de debates parlamentares é essencial para a transparência, a responsabilidade e a acessibilidade da governação democrática. Tradicionalmente, esta tarefa é manual, morosa e depende de pessoas especializadas nessas tarefas. Este trabalho descreve o estudo, desenho e implementação de um sistema de transcrição para processamento automático dos debates parlamentares na Assembleia da República de Portugal, através de uma solução inovadora que utiliza tecnologias avançadas de reconhecimento automático de fala e de reconhecimento de mudança de orador. O Sistema de Transcrição Automática (STAAR) foi desenvolvido após uma análise das tecnologias existentes e das necessidades específicas da Assembleia da República e resultou numa solução que se integra eficazmente com os processos existentes e prevê a evolução contínua da tecnologia. O sistema revelou-se de grande valor, não só pela sua eficácia e rapidez na transcrição de debates parlamentares, mas também pela sua capacidade em adaptar-se à linguagem parlamentar e ao jargão específico. As conclusões deste trabalho revelam que o STAAR superou as expectativas ao apresentar uma taxa de erro bastante baixa, ao reduzir o tempo necessário para a produção do primeiro rascunho do Diário da AR e ao permitir a transcrição de reuniões de comissões parlamentares que anteriormente não eram documentadas, aumentando a abrangência e detalhe na documentação das atividades parlamentares. Este avanço representa um passo significativo na modernização dos processos parlamentares, na promoção de maior transparência e acessibilidade das informações políticas e posiciona a Assembleia da República de Portugal na vanguarda da inovação tecnológica, no contexto da transcrição de debates parlamentares.The transcription of parliamentary debates is essential for transparency, accountability, and accessibility in democratic governance. Traditionally, this task is manual, time-consuming, and relies on specialized individuals. This work describes the study, design, and implementation of a transcription system for the automatic processing of parliamentary debates in the Assembly of the Republic of Portugal, through an innovative solution that uses advanced speech-to-text and speaker diarization technologies. The Automatic Transcription System (STAAR) was developed after analyzing existing technologies and the specific needs of the Assembly of the Republic, resulting in a solution that effectively integrates with existing processes and anticipates continuous technological evolution. The system proved to be of great value, not only for its efficiency and speed in transcribing parliamentary debates but also for its ability to adapt to parliamentary language and specific terms. The conclusions of this work show that STAAR exceeded expectations by presenting a very low error rate, reducing the time needed to produce the first draft of the Assembly of the Republic's Journal, and enabling the transcription of parliamentary committee meetings that weren’t previously documented, thus increasing the scope and detail in the documentation of parliamentary activities. This advancement represents a significant step in modernizing parliamentary processes, promoting greater transparency and accessibility of political information, and positions the Assembly of the Republic of Portugal at the forefront of technological innovation in the context of transcription of parliamentary debates.2024-02-15T15:07:44Z2024-01-09T00:00:00Z2024-01-092023-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10071/31035TID:203484258porNascimento, Pedro Miguel Delgado doinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-18T01:17:14Zoai:repositorio.iscte-iul.pt:10071/31035Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:38:39.614641Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse
dc.title.none.fl_str_mv Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
title Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
spellingShingle Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
Nascimento, Pedro Miguel Delgado do
Transcrição automática
Debates parlamentares
Reconhecimento de fala
Processamento de linguagem natural - -- NLP Natural language processing
Machine learning
Diarização de orador
Automatic transcription
Parliamentary debates
Speech recognition
Speaker diarization
title_short Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
title_full Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
title_fullStr Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
title_full_unstemmed Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
title_sort Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
author Nascimento, Pedro Miguel Delgado do
author_facet Nascimento, Pedro Miguel Delgado do
author_role author
dc.contributor.author.fl_str_mv Nascimento, Pedro Miguel Delgado do
dc.subject.por.fl_str_mv Transcrição automática
Debates parlamentares
Reconhecimento de fala
Processamento de linguagem natural - -- NLP Natural language processing
Machine learning
Diarização de orador
Automatic transcription
Parliamentary debates
Speech recognition
Speaker diarization
topic Transcrição automática
Debates parlamentares
Reconhecimento de fala
Processamento de linguagem natural - -- NLP Natural language processing
Machine learning
Diarização de orador
Automatic transcription
Parliamentary debates
Speech recognition
Speaker diarization
description A transcrição de debates parlamentares é essencial para a transparência, a responsabilidade e a acessibilidade da governação democrática. Tradicionalmente, esta tarefa é manual, morosa e depende de pessoas especializadas nessas tarefas. Este trabalho descreve o estudo, desenho e implementação de um sistema de transcrição para processamento automático dos debates parlamentares na Assembleia da República de Portugal, através de uma solução inovadora que utiliza tecnologias avançadas de reconhecimento automático de fala e de reconhecimento de mudança de orador. O Sistema de Transcrição Automática (STAAR) foi desenvolvido após uma análise das tecnologias existentes e das necessidades específicas da Assembleia da República e resultou numa solução que se integra eficazmente com os processos existentes e prevê a evolução contínua da tecnologia. O sistema revelou-se de grande valor, não só pela sua eficácia e rapidez na transcrição de debates parlamentares, mas também pela sua capacidade em adaptar-se à linguagem parlamentar e ao jargão específico. As conclusões deste trabalho revelam que o STAAR superou as expectativas ao apresentar uma taxa de erro bastante baixa, ao reduzir o tempo necessário para a produção do primeiro rascunho do Diário da AR e ao permitir a transcrição de reuniões de comissões parlamentares que anteriormente não eram documentadas, aumentando a abrangência e detalhe na documentação das atividades parlamentares. Este avanço representa um passo significativo na modernização dos processos parlamentares, na promoção de maior transparência e acessibilidade das informações políticas e posiciona a Assembleia da República de Portugal na vanguarda da inovação tecnológica, no contexto da transcrição de debates parlamentares.
publishDate 2023
dc.date.none.fl_str_mv 2023-12
2024-02-15T15:07:44Z
2024-01-09T00:00:00Z
2024-01-09
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10071/31035
TID:203484258
url http://hdl.handle.net/10071/31035
identifier_str_mv TID:203484258
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron:RCAAP
instname_str Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
instacron_str RCAAP
institution RCAAP
reponame_str Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
collection Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)
repository.name.fl_str_mv Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação
repository.mail.fl_str_mv
_version_ 1799137437560078336