Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Tytuł pozycji:

Continuous speech commands recognition with thai language used support vector machine technique: A case study of speech commands control for mobile robots

Tytuł:
Continuous speech commands recognition with thai language used support vector machine technique: A case study of speech commands control for mobile robots
Autorzy:
Muangjaroen, Supavit
Udomsiri, Sakol
Data publikacji:
2023
Słowa kluczowe:
thai language
continuous speech command
support vector machine
SVM
automatic speech recognition
ASR
automatyczne rozpoznawanie mowy
język tajski
polecenie głosowe
Język:
angielski
Dostawca treści:
BazTech
Artykuł
  Przejdź do źródła  Link otwiera się w nowym oknie  Pełny tekst  Link otwiera się w nowym oknie
This article presents the application of an automatic speech recognition by continuous speech commands recognition with Thai language as a speaker verification model, this is a case study of speech commands control of mobile robots. The design of the automatic speech recognition system consisted of 3 steps: The first we analyzed the signal processing of the continuous speech commands and compared the accuracy of the speech recognition with a time frame adjustment and the overlapped period of signal filtered with the window function, The second we proceed to find the feature extraction of speech commands using format frequency techniques and configured the feature extraction with format frequencies of F1, F2, and F3,The last step was to design the recognition using Support Vector Machine technique to check the accuracy of an automatic speech recognition. These is support vector machine classification algorithm provides a comparison of the filtered function window and compares the accuracy of the time frame scaled and the overlapped time of the filtered, which gives different values of precision. From the experiment, the researcher found that are applied a Hanging function the test results of the test result of the "forward" speech commands has an accuracy of 81.92% but kind of Gaussian function the test results of the "backward" speech commands has an accuracy of 83.69%, the "turn left" speech commands had an accuracy of 82.81%, the "turn right" speech commands had an accuracy of 85.56% and the "Stop first" speech commands has an accuracy of 86.78% and speech recognition by continuous speech commands recognition with Thai language was applied an every function the test results of the overall performance of the speech commands has an accuracy of 83.88%.
Artykuł przedstawia zastosowanie automatycznego rozpoznawania mowy poprzez ciągłe rozpoznawanie poleceń głosowych z językiem tajskim jako modelem weryfikacji mówiącego, jest to studium przypadku sterowania poleceniami głosowymi robotów mobilnych. Projekt systemu automatycznego rozpoznawania mowy składał się z 3 etapów: W pierwszym przeanalizowano przetwarzanie sygnału ciągłych poleceń głosowych i porównano dokładność rozpoznawania mowy z dopasowaniem przedziału czasowego i nakładającym się okresem sygnału filtrowanego funkcją okna, Następnie przystępujemy do znalezienia ekstrakcji funkcji poleceń głosowych przy użyciu technik formatowania częstotliwości i skonfigurowania ekstrakcji cech z częstotliwościami formatu F1, F2 i F3. Ostatnim krokiem było zaprojektowanie rozpoznawania przy użyciu techniki maszyny wektorów nośnych w celu sprawdzenia dokładności automatyczne rozpoznawanie mowy. Jest to algorytm klasyfikacji maszyny wektorów nośnych, który zapewnia porównanie przefiltrowanego okna funkcji i porównuje dokładność skalowanych ram czasowych oraz nakładających się czasów filtrowanych, co daje różne wartości precyzji. Na podstawie eksperymentu badacz odkrył, że po zastosowaniu funkcji wiszącej wyniki testu wyników poleceń głosowych „do przodu” mają dokładność 81,92%, ale rodzaj funkcji Gaussa wyniki testu poleceń głosowych „wstecz” mają dokładność 81,92% dokładność 83,69%, polecenia głosowe „skręć w lewo” miały dokładność 82,81%, polecenia głosowe „skręć w prawo” miały dokładność 85,56%, a polecenia głosowe „Najpierw zatrzymaj” mają dokładność 86,78%, a rozpoznawanie mowy przez zastosowano ciągłe rozpoznawanie poleceń głosowych w języku tajskim, a wyniki testu ogólnej wydajności poleceń głosowych mają dokładność 83,88%.
Opracowanie rekordu ze środków MNiSW, umowa nr SONP/SP/546092/2022 w ramach programu "Społeczna odpowiedzialność nauki" - moduł: Popularyzacja nauki i promocja sportu (2024).

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies