Czech parliament meeting recordings as ASR training data

Szczegóły
Abstrakt

Tytuł:: Czech parliament meeting recordings as ASR training data
Autorzy:: Krůza, Jan Oldřich
Data publikacji:: 2020
Słowa kluczowe:: audio signal processing
feature selection
artificial intelligence
natural language processing
speech recognition
speech synthesis
przetwarzanie sygnału audio
wybór funkcji
sztuczna inteligencja
przetwarzanie języka naturalnego
rozpoznawanie mowy
synteza mowy
Język:: angielski
Dostawca treści:: BazTech
: Artykuł

Przejdź do źródła

I present a way to leverage the stenographed recordings of the Czech parliament meetings for purposes of training a speech-to-text system. The article presents a method for scraping the data, acquiring word-level alignment and selecting reliable parts of the imprecise transcript. Finally, I present an ASR system trained on these and other data.

1. Track 1: Artificial Intelligence

2. Technical Session: 5th International Workshop on Language Technologies and Applications

3. Opracowanie rekordu ze środków MNiSW, umowa Nr 461252 w ramach programu "Społeczna odpowiedzialność nauki" - moduł: Popularyzacja nauki i promocja sportu (2021).

Informacja

Czech parliament meeting recordings as ASR training data