Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
Texto Completo: | http://hdl.handle.net/10071/31035 |
Resumo: | A transcrição de debates parlamentares é essencial para a transparência, a responsabilidade e a acessibilidade da governação democrática. Tradicionalmente, esta tarefa é manual, morosa e depende de pessoas especializadas nessas tarefas. Este trabalho descreve o estudo, desenho e implementação de um sistema de transcrição para processamento automático dos debates parlamentares na Assembleia da República de Portugal, através de uma solução inovadora que utiliza tecnologias avançadas de reconhecimento automático de fala e de reconhecimento de mudança de orador. O Sistema de Transcrição Automática (STAAR) foi desenvolvido após uma análise das tecnologias existentes e das necessidades específicas da Assembleia da República e resultou numa solução que se integra eficazmente com os processos existentes e prevê a evolução contínua da tecnologia. O sistema revelou-se de grande valor, não só pela sua eficácia e rapidez na transcrição de debates parlamentares, mas também pela sua capacidade em adaptar-se à linguagem parlamentar e ao jargão específico. As conclusões deste trabalho revelam que o STAAR superou as expectativas ao apresentar uma taxa de erro bastante baixa, ao reduzir o tempo necessário para a produção do primeiro rascunho do Diário da AR e ao permitir a transcrição de reuniões de comissões parlamentares que anteriormente não eram documentadas, aumentando a abrangência e detalhe na documentação das atividades parlamentares. Este avanço representa um passo significativo na modernização dos processos parlamentares, na promoção de maior transparência e acessibilidade das informações políticas e posiciona a Assembleia da República de Portugal na vanguarda da inovação tecnológica, no contexto da transcrição de debates parlamentares. |
id |
RCAP_ded70ccc16e813c12e743f210a8c88c8 |
---|---|
oai_identifier_str |
oai:repositorio.iscte-iul.pt:10071/31035 |
network_acronym_str |
RCAP |
network_name_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository_id_str |
7160 |
spelling |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República PortuguesaTranscrição automáticaDebates parlamentaresReconhecimento de falaProcessamento de linguagem natural - -- NLP Natural language processingMachine learningDiarização de oradorAutomatic transcriptionParliamentary debatesSpeech recognitionSpeaker diarizationA transcrição de debates parlamentares é essencial para a transparência, a responsabilidade e a acessibilidade da governação democrática. Tradicionalmente, esta tarefa é manual, morosa e depende de pessoas especializadas nessas tarefas. Este trabalho descreve o estudo, desenho e implementação de um sistema de transcrição para processamento automático dos debates parlamentares na Assembleia da República de Portugal, através de uma solução inovadora que utiliza tecnologias avançadas de reconhecimento automático de fala e de reconhecimento de mudança de orador. O Sistema de Transcrição Automática (STAAR) foi desenvolvido após uma análise das tecnologias existentes e das necessidades específicas da Assembleia da República e resultou numa solução que se integra eficazmente com os processos existentes e prevê a evolução contínua da tecnologia. O sistema revelou-se de grande valor, não só pela sua eficácia e rapidez na transcrição de debates parlamentares, mas também pela sua capacidade em adaptar-se à linguagem parlamentar e ao jargão específico. As conclusões deste trabalho revelam que o STAAR superou as expectativas ao apresentar uma taxa de erro bastante baixa, ao reduzir o tempo necessário para a produção do primeiro rascunho do Diário da AR e ao permitir a transcrição de reuniões de comissões parlamentares que anteriormente não eram documentadas, aumentando a abrangência e detalhe na documentação das atividades parlamentares. Este avanço representa um passo significativo na modernização dos processos parlamentares, na promoção de maior transparência e acessibilidade das informações políticas e posiciona a Assembleia da República de Portugal na vanguarda da inovação tecnológica, no contexto da transcrição de debates parlamentares.The transcription of parliamentary debates is essential for transparency, accountability, and accessibility in democratic governance. Traditionally, this task is manual, time-consuming, and relies on specialized individuals. This work describes the study, design, and implementation of a transcription system for the automatic processing of parliamentary debates in the Assembly of the Republic of Portugal, through an innovative solution that uses advanced speech-to-text and speaker diarization technologies. The Automatic Transcription System (STAAR) was developed after analyzing existing technologies and the specific needs of the Assembly of the Republic, resulting in a solution that effectively integrates with existing processes and anticipates continuous technological evolution. The system proved to be of great value, not only for its efficiency and speed in transcribing parliamentary debates but also for its ability to adapt to parliamentary language and specific terms. The conclusions of this work show that STAAR exceeded expectations by presenting a very low error rate, reducing the time needed to produce the first draft of the Assembly of the Republic's Journal, and enabling the transcription of parliamentary committee meetings that weren’t previously documented, thus increasing the scope and detail in the documentation of parliamentary activities. This advancement represents a significant step in modernizing parliamentary processes, promoting greater transparency and accessibility of political information, and positions the Assembly of the Republic of Portugal at the forefront of technological innovation in the context of transcription of parliamentary debates.2024-02-15T15:07:44Z2024-01-09T00:00:00Z2024-01-092023-12info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10071/31035TID:203484258porNascimento, Pedro Miguel Delgado doinfo:eu-repo/semantics/openAccessreponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos)instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãoinstacron:RCAAP2024-02-18T01:17:14Zoai:repositorio.iscte-iul.pt:10071/31035Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireopendoar:71602024-03-20T02:38:39.614641Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informaçãofalse |
dc.title.none.fl_str_mv |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa |
title |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa |
spellingShingle |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa Nascimento, Pedro Miguel Delgado do Transcrição automática Debates parlamentares Reconhecimento de fala Processamento de linguagem natural - -- NLP Natural language processing Machine learning Diarização de orador Automatic transcription Parliamentary debates Speech recognition Speaker diarization |
title_short |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa |
title_full |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa |
title_fullStr |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa |
title_full_unstemmed |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa |
title_sort |
Sistema de transcrição automática de debates parlamentares no contexto da Assembleia da República Portuguesa |
author |
Nascimento, Pedro Miguel Delgado do |
author_facet |
Nascimento, Pedro Miguel Delgado do |
author_role |
author |
dc.contributor.author.fl_str_mv |
Nascimento, Pedro Miguel Delgado do |
dc.subject.por.fl_str_mv |
Transcrição automática Debates parlamentares Reconhecimento de fala Processamento de linguagem natural - -- NLP Natural language processing Machine learning Diarização de orador Automatic transcription Parliamentary debates Speech recognition Speaker diarization |
topic |
Transcrição automática Debates parlamentares Reconhecimento de fala Processamento de linguagem natural - -- NLP Natural language processing Machine learning Diarização de orador Automatic transcription Parliamentary debates Speech recognition Speaker diarization |
description |
A transcrição de debates parlamentares é essencial para a transparência, a responsabilidade e a acessibilidade da governação democrática. Tradicionalmente, esta tarefa é manual, morosa e depende de pessoas especializadas nessas tarefas. Este trabalho descreve o estudo, desenho e implementação de um sistema de transcrição para processamento automático dos debates parlamentares na Assembleia da República de Portugal, através de uma solução inovadora que utiliza tecnologias avançadas de reconhecimento automático de fala e de reconhecimento de mudança de orador. O Sistema de Transcrição Automática (STAAR) foi desenvolvido após uma análise das tecnologias existentes e das necessidades específicas da Assembleia da República e resultou numa solução que se integra eficazmente com os processos existentes e prevê a evolução contínua da tecnologia. O sistema revelou-se de grande valor, não só pela sua eficácia e rapidez na transcrição de debates parlamentares, mas também pela sua capacidade em adaptar-se à linguagem parlamentar e ao jargão específico. As conclusões deste trabalho revelam que o STAAR superou as expectativas ao apresentar uma taxa de erro bastante baixa, ao reduzir o tempo necessário para a produção do primeiro rascunho do Diário da AR e ao permitir a transcrição de reuniões de comissões parlamentares que anteriormente não eram documentadas, aumentando a abrangência e detalhe na documentação das atividades parlamentares. Este avanço representa um passo significativo na modernização dos processos parlamentares, na promoção de maior transparência e acessibilidade das informações políticas e posiciona a Assembleia da República de Portugal na vanguarda da inovação tecnológica, no contexto da transcrição de debates parlamentares. |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-12 2024-02-15T15:07:44Z 2024-01-09T00:00:00Z 2024-01-09 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10071/31035 TID:203484258 |
url |
http://hdl.handle.net/10071/31035 |
identifier_str_mv |
TID:203484258 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) instname:Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação instacron:RCAAP |
instname_str |
Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
collection |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) |
repository.name.fl_str_mv |
Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) - Agência para a Sociedade do Conhecimento (UMIC) - FCT - Sociedade da Informação |
repository.mail.fl_str_mv |
|
_version_ |
1799137437560078336 |