Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Tytuł pozycji:

Wyznaczanie fragmentów kodujących w sekwencjach genomowych

Tytuł:
Wyznaczanie fragmentów kodujących w sekwencjach genomowych
Determination of encoding fragments in genomic sequences.
Autorzy:
Turek, Cezary
Słowa kluczowe:
gen, ekson, DNA, RNA, translacja, transkrypcja, PDB, RefSec, białka
gen, exon, DNA, RNA, translation, transcription, PDB, RefSec, proteins
Język:
polski
Dostawca treści:
Repozytorium Uniwersytetu Jagiellońskiego
Inne
  Przejdź do źródła  Link otwiera się w nowym oknie
1.Title of master thesis: „Determination of encoding fragments in genomic sequences.” 2.Data:I.Author: Cezary TurekII.Tutor of master thesis: Prof. dr hab. Irena Roterman-Konieczna3.Summary:I.Foreword: Thesis focuses on identification of coding sequences into nucleotide sequence including exons. Main effort rests on association of databases which contain data about proteins and data about genomes. This thesis is limited to human genome. Application which is a result of that work is achieved by the Internet.II.Materials and methods: Data which are necessary to make computations connected with subject are in public databases. For the purposes of this work I am using three public databases: PDB (Protein Data Bank), RefSec (Reference Sequence Database) and UniProt (Universal Protein Resource). The first one provides information about protein which will be analyzed, the second database contains sequences DNA including metadata about them. The last database is used to make mapping from PDB to RefSec in relation one to many. To creation of the application I used tools, technologies and frameworks like Eclipse IDE, Tomcat 8, Maven, Git, Java 8, BioJava, Spring, UML, HTML, CSS, XML.III.Results: Main aim has been set by me in this thesis was reached as an internet application. System including documentation was deployed into environment without any problem. Documentation describes how to install, configure and use system. It includes descriptions about application input and outputs. Main output describes exons which code particular protein was found in database and was fitted to the sequence of protein. Analyzing that file you can easy take data which are interested from scientific point of view. Algorithm analyzes data use in this application is clear and readable. Additionally this algorithm is open for modification and extension. Output data were tested on set of tests were prepared by scientists from Jagiellonian University.IV.Conclusions: In time of application development I investigated few problems connected with structure of input files, how that files are downloaded by system and how application is reached by users. Files are downloaded from PDB, RefSec are flat. That means there is no relation on records and sequences could include gaps. Additionally system depends on state of databases in the time of running. Lack of service from database site results in counting crash. I can’t skip that behavior because of application type. It has to be dynamic and use actual data. Application will be tool used in scientist environment with possibility to access by the Internet. That fact is my biggest success.

1.Tytuł pracy: „Wyznaczanie fragmentów kodujących w sekwencjach genomowych” 2.Dane:I.Autor: Cezary TurekII.Opiekun Pracy: Prof. dr hab. Irena Roterman-Konieczna3.Streszczenie:I.Wstęp: Praca skupia się na identyfikacji odcinków kodujących w sekwencji nukleotydów z rozróżnieniem egzonowych. Główny wysiłek polega na skojarzeniu baz danych białkowych i genomowych. Praca jest ograniczona do genomu człowieka. Oczekiwany jest program dostępny z komputera personalnego za pośrednictwem sieci internetowej.II.Materiały i metody: Dane niezbędne do przeprowadzenia analizy związanej z tematem są umieszczone w publicznych bazach danych. Dla potrzeb tej pracy wykorzystywane są trzy bazy danych: PDB, RefSec i UniProt. Pierwsza z nich dostarcza informacji o białku poddawanym analizie, druga zawiera sekwencje DNA wraz z metadanymi na ich temat natomiast trzecia służy do mapowania danych z PDB na RefSec w relacji jeden do wielu. Do stworzenia aplikacji analizującej dane używam następujące technologie i narzędzia: Eclipse IDE, Tomcat 8, Maven, Git, Java 8, BioJava, Spring, UML, HTML, CSS, XML.III.Wyniki: Cel wyznaczony w temacie pracy magisterskiej został osiągnięty w postaci aplikacji internetowej. System został bez problemu wdrożony do użytku wraz z dokumentacją opisującą instalację, konfigurację, dane wejściowe ze wspomnianych baz danych oraz dane wynikowe, które są kluczowe. Główne wyjście programu opisuje egzony kodujące dane białko znalezione w bazie danych i dopasowane do jego sekwencji. Analizując dany plik można w łatwy sposób wyciągnąć interesujące z naukowego punktu widzenia informacje. Algorytm analizujący dane zastosowany w aplikacji jest przejrzysty i czytelny, a jednocześnie otwarty na dalsze modyfikacje. Ponadto dane wyjściowe zostały przetestowane na zweryfikowanej uprzednio próbce danych, dając właściwe wyniki.IV.Wnioski: W trakcie tworzenia programu napotkano na kilka przeszkód związanych z strukturą plików danych wejściowych, ich pobieraniem oraz samym dostępem do aplikacji. Pliki pobierane z PDB, RefSec są plikami typu Flat file, co oznacza, że ich rekordy są niezestrukturyzowane relacją i mogą zawierać luki w sekwencjach. Program jest ponadto zależny od stany baz danych w momencie jego wykonywania. Brak działającego serwisu dostępu do danych ze strony dostawcy skutkuje niemożnością przeprowadzenia obliczeń. Nie da się jednak tego pominąć, gdyż aplikacja ma być dynamiczna i odnosić się do aktualnego stanu danych. Aplikacja będzie faktycznie używanym narzędziem w środowisku naukowym z możliwością dostępu do niej przez sieć internetową. Jest to dla mnie dużym sukcesem.

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies