Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Tytuł pozycji:

Learning rate interference to overcome overfitting for Audio Emotion Recognition using LSTM

Tytuł:
Learning rate interference to overcome overfitting for Audio Emotion Recognition using LSTM
Autorzy:
Ayadi, Souha
Lachiri, Zied
Data publikacji:
2024
Słowa kluczowe:
audio emotion recognition
learning rate
LSTM
rozpoznawanie emocji dźwiękowych
szybkość uczenia się
Język:
angielski
Dostawca treści:
BazTech
Artykuł
  Przejdź do źródła  Link otwiera się w nowym oknie  Pełny tekst  Link otwiera się w nowym oknie
This paper presents a neural network architecture approach to recognize human emotions on features extracted from an audio song. The features used to train the classifier are extracted using Mel Frequency Cepstrum Coefficients (MFCC). The presented neural network architecture is built based on the LSTM network, due to its ability to learn long-term dependencies and its simple implementation that helps highlight the importance of the learning rate hyper-parameter. By tuning the learning rate, the neural network tracks it regularly each time the weights are updated. Which worked perfectly to overcome the overfitting problem and achieve an accuracy result of 75.80%.
W artykule przedstawiono podejście oparte na architekturze sieci neuronowej umożliwiające rozpoznawanie ludzkich emocji na podstawie cech wyodrębnionych z utworu audio. Cechy używane do uczenia klasyfikatora są wyodrębniane przy użyciu współczynników cepstrum częstotliwości Mel (MFCC). Zaprezentowana architektura sieci neuronowej zbudowana jest w oparciu o sieć LSTM, ze względu na jej zdolność uczenia się zależności długoterminowych oraz prostą implementację, która pomaga podkreślić znaczenie hiperparametru szybkości uczenia się. Dostrajając szybkość uczenia się, sieć neuronowa śledzi ją regularnie za każdym razem, gdy wagi są zmieniane zaktualizowany. Co sprawdziło się doskonale, aby przezwyciężyć problem nadmiernego dopasowania i osiągnąć wynik dokładności 75,80%.
Opracowanie rekordu ze środków MNiSW, umowa nr POPUL/SP/0154/2024/02 w ramach programu "Społeczna odpowiedzialność nauki II" - moduł: Popularyzacja nauki i promocja sportu (2025).

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies