Tytuł pozycji:
Przewidywanie struktury drugorzędowej białek metodą słownikową
W artykule opisano sposób przewidywania struktury drugorzędowej białek, oparty na słownikach podciągów. Sekwencje te są pobierane z danych dostępnych w bazie danych PDB. W zależności od konstrukcji zestawu uczącego, osiągnięto dokładność do 79%. Do szybkiego dostępu do słowników zawierających dużą liczbę podciągów zastosowano funkcje mieszające.
This paper describes a method of predicting the secondary structure of proteins, based on dictionaries of subsequences. These subsequences are derived from records available in the PDB database. Depending on the construction of the learning set, accuracies of up to 79% have been achieved. Dictionaries use hashing functions, which make them fast and capable of storing large sets of substrings.