Alignment, programowanie dynamiczne i śmierć komórki
Im bliżej organizmy są ze sobą spokrewnione tym bardziej podobne są u nich sekwencje odpowiadających sobie genów i białek. Przykładowo, sekwencje hemoglobiny (białka umożliwiającego czerwonym krwinkom transportowanie tlenu) u szympansa i człowieka są identyczne, ponieważ szympansa i człowieka dzieli od wspólnego przodka niewiele pokoleń i niewiele mutacji zdążyło się zakumulować w ich genach i białkach. Z kolei sekwencje hemoglobiny człowieka i pingwina cesarskiego są podobne już tylko w 67%. Sprawdzenie, na ile dwie sekwencje są do siebie podobne jest więc dosyć istotnym i wbrew pozorom nieprostym zagadnieniem.
Jedną z metod oceniania podobieństwa sekwencji jest policzenie, ile co najmniej mutacji musiałoby zajść w jednej sekwencji żeby przeszła w drugą. Przyjmujemy, że mutacją może być zmiana pojedynczego nukleotydu/aminokwasu w inny oraz odpadnięcie lub doczepienie pojedynczego nukleotydu/aminokwasu. Przykładowo: żeby sekwencja aminokwasów ALAMAPSA zmutowała do ALAPSA wystarczą dwie mutacje: zniknięcie aminokwasu M oraz A; z kolei, żeby HELPIMTRAPPEDINAPEPTIDE przeszło w HELPMETRAPPEDWITHINPEPTIDE musiało zajść co najmniej siedem mutacji:
- IM przeszło na ME, co mogło się zdarzyć na dwa sposoby: I zmutowało w M, a M w E albo I wypadło, a wpadło E; w obu przypadkach mamy dwie mutacje
- wskoczyły cztery aminokwasy W, I, T, i H przed IN
- odpadła alanina (A) przed PEPTIDE
Łatwiej to widać, jeśli przygotuje się tzw. #alignment. Polega on na tym, że dwie porównywane sekwencje podpisujemy pod sobą, rysując '-' tam, gdzie w jednej sekwencji fragment odpadł lub w drugiej przybył, '|' między literami jeśli są identyczne i zostawiając wolne miejsce jeśli nie są. Dla pierwszego przykładu wyglądałby on tak:
A | L | A | M | A | P | S | A |
| | | | | | | | | | | | ||
A | L | A | - | - | P | S | A |
A dla drugiego tak:
H | E | L | P | I | M | T | R | A | P | P | E | D | - | - | - | - | I | N | A | P | E | P | T | I | D | E |
| | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | |||||||
H | E | L | P | M | E | T | R | A | P | P | E | D | W | I | T | H | I | N | - | P | E | P | T | I | D | E |
O ile sekwencje są krótkie, a mutacji nie ma wiele można się pokusić o szacowanie najmniejszej liczby mutacji na oko, jednak dla dłuższych sekwencji byłoby to karkołomne przedsięwzięcie. Dlatego stosuje się różne algorytmy, które tworzą taki alignment i wyliczają minimalną liczbę zmian między sekwencjami. Algorytmy te najczęściej stosują #programowanie_dynamiczne.
W załączonym pliku znajdują się trzy sekwencje tego samego białka (kaspazy 8, jednego z białek uruchamiających #szlak_sygnałowy prowadzący do programowanej śmierci komórki) - z człowieka, myszy i muszki owocówki. Twoim zadaniem jest przygotowanie alignmentu każdej z tych sekwencji z każdą inną, sprawdzenie, która para jest między sobą najbardziej podobna i podanie najmniejszej liczby mutacji jaka była potrzebna, żeby jedna z nich przeszła w drugą.
Załącznik | Wielkość |
---|---|
kaspaza-8.fasta | 1.5 KB |
- Zaloguj się albo zarejestruj aby dodać rozwiązanie