Tytuł pozycji:
Empiryczna eksploracja uczenia spektralnego ukrytych modeli Markowa
Przedmiotem pracy jest analiza i konfrontacja tradycyjnej metody estymacji ukrytego modelu Markowa takiej jak algorytm Bauma-Welcha dla jednej lub wielu sekwencji z innowacyjną metodą uczenia spektralnego. Celem uczenia spektralnego jest estymacja reprezentacji obserwowalnej, a następnie spektralnej ukrytego modelu Markowa, której znajomość pozwala na znalezienie estymatorów prawdopodobieństw łącznych oraz warunkowych emisji dowolnej sekwencji symboli. Znajomość jakiejkolwiek z tych reprezentacji umożliwia również odzyskanie, na ogół w sposób niejednoznaczny, modelu w postaci tradycyjnej, niemniej jednak nie jest znane bliżej zachowanie tak uzyskanych estymatorów. Część teoretyczną pracy stanowi omówienie matematycznych podstaw porównywanych metod uczenia modelu, a dla uczenia spektralnego wyprowadzono założenia konieczne dla sensowności przeprowadzanych metod. Podajemy również przekształcenia algebraiczne pozwalające na odzyskanie reprezentacji tradycyjnej modelu na podstawie reprezentacji obserwowalnej czy spektralnej. Część eksperymentalna pracy przedstawia wyniki odpowiednich implementacji napisanych w środowisku programu R. Wyniki serii eksperymentów zostały poddane krytycznej analizie.
The main subject of the paper is the analysis and confrontation of a traditional estimation method for hidden Markov models (for short hmms) such as the Baum Welch algorithm for one or multiple sequences with the innovative spectral learning algorithm. The aim of the spectral learning method relies on estimating the so-called observable and spectral representations of hmms which are then used to calculate estimators of joint or conditional probability estimators for any symbol sequence. Knowing any of these representations allows to retrieve, generally not in a unique manner , a traditional representation of the model, however behavior of estimators derived in this way is not clearly defined. The theoretical part of the paper contains mathematical background of the compared methods, in case of spectral learning we derive all the assumptions necessary to make the method sensible. We also present algebraic transformations allowing to recover the conventional representation of the model on the grounds of its observable or spectral representation. The experimental part of the paper presents the results of the implementations run in the environment of the R programming language. The series of experiments are then critically analyzed.