Prawdziwa eksplozja ilości danych pochodzących z projektów sekwencjo-nowania genomów roślinnych, jaką obserwujemy w ostatnich latach, spowodowała rozwój nowej dziedziny wiedzy poświęconej analizie gromadzonych informacji. Niniejsza praca przedstawia wkład autora w badania nad bioinformatyką genomów roślinnych oraz przegląd współcześnie stosowanych strategii sekwencjonowania oraz analizy sekwencji genomowych
Plant genomes: selected methods of discovery and analysis
In modern biology complete genom e sequences are a powerful to ol utilized for the detailed characterization of living organisms. The analysis of many plant genomes is hampered by their large size and complexity. Therefore, various strategies have been developed to provide alternatives to lower the cost and speed-up their sequencing projects. Bioinformatics plays a central role in many areas of genomic research. MOsDB (MIPS Oryza sativa Database) was created to provide researchers with a highly integrated information system of rice genome sequence. Application of tools integrated into COBALT system (Comprehensive Biological Data Analysis System), which represents automatic sequence analysis pipeline, resulted in annotation of genomic DNA :Erom rice. Comparative analysis oftwo gene familie s :Erom Arabidopsis and rice coding for Receptor-Like Kinases and START-domain proteins provided insight into mechanisms involved in gene expansion during the evolution of both species. Finally, computational analysis of an 'unfinished' maize genome allowed the exploration of repeat sequence content, gene number and history of genome evolution.
Spis treści:
Od Autora
Wprowadzenie
1. Poznane genomy roślinne
1.1. Sekwencje kodujące w genomach roślin
1.1.1. Geny kodujące białka
1.1.2. Geny kodujące RNA
1.2. Sekwencje powtarzalne i transpozony
2. Strategie sekwencjonowania genomów roślinnych
2.1. Metoda oparta na mapach fizycznych i genetycznych genomu
2.2. Sekwencjonowanie losowych fragmentów genomu
2.3. Wybór reprezentatywnej puli sekwencji
2.4. Metoda filtrowania sekwencji genomowych
2.5. Znakowanie i sekwencjonowanie kodujących fragmentów genomu
2.6. Sekwencjonowanie produktów ekspresji genów
3. Strategie przechowywania informacji pochodzących z sekwencjonowania genomów roślinnych
3.1. Architektura systemu przechowywania danych (MOsDB)
3.2. Interfejs użytkownika
4. COBALT: zintegrowany system analiz sekwencji biologicznych
4.1. Architektura systemu
4.2. Składowanie danych w systemie COBALT
4.3. Poziom meta systemu analiz COBALT
5. Adnotacja sekwencji genomowej, analizy porównawcze i filogenetyczne: ryż (Oryza sativa) i kukurydza (Zea mays)
5.1. MAP: adnotacja sekwencji genomowych z ryżu i kukurydzy
5.2. Adnotacja i analiza porównawcza genów kodujących białka kroaz receptorowych RLK z ryżu i Arabidopsis
5.2.1. Wzrost liczby genów RLK w ryżu: adnotacja i analiza sekwencji
5.2.2. Ewolucja genomów: analiza duplikacji sekwencji
5.3. Adnotacja i analiza porównawcza genów kodujących białka zawierające domeny START w genomach ryżu i Arabidopsis
6. Analiza genomów ?niedokończonych": kukurydza (Zea mays)
6.1. Jak należy sekwencjonować genom kukurydzy?
6.2. Sekwencjonowanie genomu kukurydzy
6.2.1. Określenie liczby sekwencji BES potrzebnych do analizy genomu kukurydzy
6.2.2. Sekwencjonowanie końców klonów BAC
6.2.3. Mapa fizyczna klonów BAC
6.3. Analiza genomu kukurydzy: zestawy kontrolne
6.4. Skład genomu kukurydzy
6.5. GFS: organizacja genomu kukurydzy
Zakończenie
Literatura
Plant genomes: selected methods of discovery and analysis (Summary)