Tytuł pozycji:
Efektywność rozpoznawania mowy w zależności od rozmiaru danych wzorcowych
W artykule przedstawiono zastosowanie biblioteki НТК do budowy sieci probabilistycznej przeznaczonej do rozpoznawania wypowiedzi w języku polskim. Opisano konstrukcję sieci na poziomie fonemów, transkrypcji fonetycznej i gramatyki języka. Opisano metodę automatycznego tworzenia sieci dla różnych zbiorów wzorcowych i wyniki rozpoznawania dla zbiorów o różnej liczbie elementów.
This article presents an approach of building a speech recognizer for the Polish language using the НТК toolkit. All levels of the constructed recognition network have been described: phoneme models, transcription and language grammar. A method of automated building of such networks for different training sets has been presented, with results of recognition for training sets of varying sizes.