Pomóż biologom i posortuj próbki.
Biologia
Modyfikacje posttranslacyjne (PTM) to modyfikacje białek, jakie zachodzą po procesie translacji. Modyfikacje te mogą wpłynąć na funkcjonowanie białka, jego aktywność, stabilność, właściwości fizykochemiczne. Do modyfikacji posttranslacyjnych zaliczamy między innymi hydroksylację, ubikwitynację, glikozylację, acetylację, metylację czy fosforylację. W pliku phosphoELM.txt znajdują się informacje na temat fosforylacji grupy białek. Każdy wiersz pliku phosphoELM2.txt dotyczy jednej fosforylacji.
Napisz program, który policzy który aminokwas występuje najczęściej w podanej sekwencji.
Podobnie jak w zadaniu ChIP-seq i czynniki transkrypcyjne, będziemy sprawdzać gdzie do DNA przyczepiony był czynnik transkrypcyjny. Tym razem jednak zamiast gotowego pliku z policzonymi miejscami, z których pochodziły fragmenty z sekwenatora, dysponujemy samymi odczytami.
W zadaniu INTERAKCJE BIAŁEK znaleźliśmy białko, które oddziałuje z największą liczbą białek w podanej sieci interakcji - oznaczmy je jako białko A. Kontynuujmy badanie tej sieci: znajdź wszystkie białka oddziałujące z białkiem A. Podaj ile jest takich białek i z iloma średnio białkami oddziałują białka oddziałujące z A. Jako wynik wpisz dwie liczby całkowite, oddzialone spacją.
Zasada komplentarności dotyczy łączenia się zasad azotowych, które występują w kwasach nukleinowych (np. DNA). Adenina łączy się podwójnym wiązaniem wodorowym z tyminą, a cytozyna potrójnym wiązaniem wodorowym z guaniną. W związku z tym stosunek A:T i G:C w cząsteczce DNA wynosi 1, a mając jedną nić DNA możemy odtworzyć drugą. Proces ten zachodzi podczas replikacji.
Twoim zadaniem jest wczytać sekwencję DNA zawartą w pliku sekw.txt i jako rozwiązanie podać nić komplementarną.
Jeśli GC-content w kontekście genu jest dla Ciebie oczywistością - spójrzmy na problem bardziej globalnie...
Napisz program, który znajdzie najczęściej występujący 'wyraz' czteroliterowy w sekwencji nukleotydowej podwójnej nici DNA
GC-content to jeden z podstawowych parametrów liczbowych, które można uzyskać z sekwencji DNA. Można go wykorzystać, m. in. do znajdowania obszarów genomu obcego pochodzenia...