Tytuł pozycji:
Obróbka bioinformatyczna pliku w formacie VCF
- Tytuł:
-
Obróbka bioinformatyczna pliku w formacie VCF
Bioinformatic processing of a file in VCF format
- Autorzy:
-
Kania, Paulina
- Słowa kluczowe:
-
VCF, Variant Call Format, NGS, SNP, bioinformatic processing, Next Generation Sequencing, Python, converter, FASTA
VCF, Variant Call Format, NGS, SNP, obróbka bioinformatyczna, sekwencjonowanie wysokoprzepustowe, Python, konwerter, FASTA
- Język:
-
polski
- Dostawca treści:
-
Repozytorium Uniwersytetu Jagiellońskiego
-
Przejdź do źródła  Link otwiera się w nowym oknie
Sekwencjonowanie wysokoprzepustowe (ang. Next Generation Sequencing, NGS) generuje bardzo dużą ilość danych. Jednym z formatów, który pozwala na przechowywanie informacji dotyczących sekwencji i ich adnotacji jest Variant Call Format (VCF).W niniejszej pracy przedstawiono główne cechy tego formatu plików, z naciskiem na opis informacji dotyczących polimorficznych miejsc w sekwencjach. Pełnią one istotną rolę m.in. podczas badań populacyjnych.Kluczowym elementem tej pracy jest konwerter z formatu VCF na FASTA. Jest to skrypt uruchamiany z wiersza poleceń, napisany w języku Python. Pozwala to na zautomatyzowane przejścia pomiędzy podprogramami i wielokrotne uruchomienie go. Instrukcja zawarta na końcu tej pracy zawiera dokładny opis wszystkich dostępnych opcji wraz z objaśnieniem jego działania.
Next Generation Sequencing (NGS) generates a huge amount of data. One of the formats that allows the storage of information about sequences and their annotations is Variant Call Format (VCF).This thesis describes the main features of VCF file format, in particular focusing on the description of information about polymorphic sites in sequences. They have an important role in population studies, among other things.The key element of this dissertation is a converter from VCF to FASTA format. It is a script written in Python, which can be executed from command line. Therefore it is possible to execute the program in different pipelines.The appended manual includes the description of all available options as well as the explanation of the converter’s functionalities.