Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Tytuł pozycji:

Średnia identyczność nukleotydów i jej zastosowania poza wyznaczaniem granic między gatunkami prokariontów

Tytuł:
Średnia identyczność nukleotydów i jej zastosowania poza wyznaczaniem granic między gatunkami prokariontów
Average nucleotide identity and its applications beyond prokaryotic species delineation
Autorzy:
Havránek, Jan
Słowa kluczowe:
average nucleotide identity, ANI, FastANI, Mash, whole-genome similarity, prokaryotic species, population genomics, comparative genomics, bacteriophage genomics, bioinformatics
średnia tożsamość nukleotydów, ANI, FastANI, Mash, podobieństwo całogenomowe, gatunki prokariontów, genomika populacyjna, genomika porównawcza, genomika bakteriofagów, bioinformatyka
Język:
angielski
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
  Przejdź do źródła  Link otwiera się w nowym oknie
Średnia identyczność nukleotydów (average nucleotide identity, ANI) jest intuicyjną miarą podobieństwa całogenomowego. Została ona zaprojektowana do wyznaczania granic między gatunkami prokariontów, jednak w ostatnich latach zaproponowano dla niej wiele nowych zastosowań, przez co coraz ważniejsze staje się zrozumienie jej założeń i wynikających z nich ograniczeń. W tej pracy prezentuję przegląd najbardziej popularnych algorytmów do szacowania ANI, przeprowadzam porównanie ich dokładności na danych zarówno rzeczywistych, jak i symulowanych, oraz proponuję zestaw rekomendacji dotyczących ich zastosowania w różnych rodzajach badań. Poza tym zbadałem potencjał jednego z algorytmów, FastANI, do zastosowania w genomice populacyjnej bakteriofagów, w szczególności do klasyfikacji par genomów należących do tego samego rodzaju oraz do wykrywania poziomego transferu genów. Żeby lepiej zrozumieć wpływy kształtujące otrzymywane wartości ANI, przeanalizowałem również rozkłady identyczności nukleotydów pojedynczych fragmentów genomów i proponuję wykorzystanie dodatkowych miar rozkładu do bardziej szczegółowego opisu złożonych relacji między genomami.

Average nucleotide identity (ANI) is an intuitive measure of whole-genome similarity. Despite being designed for the delineation of prokaryotic species, many novel applications have been proposed in the recent years, making it increasingly important to understand the assumptions behind it and the resulting limitations. In this thesis, I present an overview of the most popular algorithms for ANI estimation, conduct a comparison of their performance on both real and simulated data, and suggest a set of recommendations for their use in different types of studies. Moreover, I investigate the potential of one of the algorithms, FastANI, for its employment in the population genomics of bacteriophages, namely for intragenus genome pair classification and detection of horizontal gene transfer events. Finally, to better understand the factors influencing ANI estimations, I examine the underlying distributions of nucleotide identities beyond a simple mean and propose the use of additional summary statistics for a more detailed description of the complex relationships between genomes.

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies