Výkonnostní techniky pro sestavování a anotaci bakteriálního genomu využívající číslicové zpracování genomických signálů

GA17-01821S
Hlavní řešitel
Popis

Projekt se zabývá výpočetní celogenomovou analýzou bakteriálních genomů pomocí metod číslicového zpracování signálů (DSP). První částí projektu je vývoj nového algoritmu pro skládání genomu s detekcí segmentů s variabilním počtem kopií (CNV) ze sekvenačních dat v signálové podobě. Tento algoritmus umožní lépe zachovat repetitivní informaci obsaženou v sekvenci nezbytnou pro další část projektu. Ta je zaměřena na detekci a klasifikaci mobilních genetických elementů (MGE) nesoucích geny antibiotické rezistence. Na základě známých MGE s pomocí metod DSP jako spektrální analýza, vlnková transformace nebo nukleotidové denzitní motivy bude sestavován vektor charakteristických příznaků potřebný pro sestavení klasifikačního modelu metodami strojového učení. Klasifikační modely budou použity pro identifikaci nepopsaných MGE, což povede k přesnějšímu popisu vzniku a šíření bakteriální rezistence. Vývoj výpočetních metod bude testován a laboratorně ověřen na reálných záznamech genomů bakterií Klebsiella pneumoniae a Clostridium difficile laboratoří molekulární biologie FN Brno.

Klíčová slova
číslicové zpracování signálů
genomický signál
celogenomová analýza
antibiotická rezistence
de-novo sestavování genomu
sekvenování nové generace
mobilní genetické elementy
metody strojového učení
Fourierova transformace
vlnková transformace
Druh projektu
Základní výzkum