Pomóż nieuważnemu technikowi wyliczyć długość użytych barcodów.
Biologia
Napisz program, który znajdzie najczęściej występujący 'wyraz' czteroliterowy w pojedynczej nici aminokwasów.
Napisz program, który policzy na ile części zostanie podzielona sekwencja po działaniu na nią kilkoma enzymami restrykcyjnymi.
Napisz program, który policzy na ile fragmentów zostanie podzielona sekwencja, jeśli specyficzna sekwencja rozpoznawalna przez enzym restrykcyjny to: GRYC (według kodu IUPAC)
FASTA to zdecydowanie najpopularniejszy format pliku służący do reprezentowania sekwencji nukleotydowych i aminokwasowych w formie cyfrowej. W dużym uproszczeniu format składa się z linii zawierających opis sekwencji (zaczynających się znakiem większości “>”) oraz z linii zawierających jednoliterowe skróty nazw nukleotydów/aminokwasów tworzących sekwencję (litery mogą być przedzielane spacjami i liczbami), przy czym te pierwsze nie są obowiązkowe. W jednym pliku może znajdować się jedna lub więcej sekwencji.
CBC (complete blood count), czyli morfologia krwi, to badanie polegające na ilościowym i jakościowym pomiarze składników krwi.
Podobnie jak w zadaniu "Składanie sekwencji", Twoim zdaniem będzie odtworzenie sekwencji DNA z otrzymanych danych; tym razem jednak dane są nieco wybrakowane.
Istnieje wiele metod poznawania sekwencji DNA (czyli sekwencjonowania DNA). Niestety, żadna z nich nie jest doskonała i żadna nie daje gotowego outputu w postaci sekwencji. Często outputem jest cały zbiór krótkich sekwencji, który następnie należy przetworzyć celem uzyskania jednej spójnej sekwencji. W załączonym pliku znajdziesz zbiór sekwencji 3-nukleotydowych, pochodzących z jednej sekwencji. Wiemy, że znajdują się w nim wszystkie możliwe fragmenty 3-nukleotydowe z oryginalnej nici, więc można odtworzyć jej sekwencję, znajdując fragmenty, które nachodzą na siebie.
Czynniki transkrypcyjne to białka, które umieją rozpoznać konkretną sekwencję w łańcuchu #DNA, związać się do niej i wywołać jakąś reakcję, np. spowodować ekspresję genu znajdującego się w pobliżu tej sekwencji bądź przeciwnie, zahamować ją. Pełnią więc bardzo istotną rolę w regulowaniu ekspresji genów. Każdy czynnik transkrypcyjny rozpoznaje jakieś konkretne, specyficzne dla niego sekwencje - niektóre tylko jedną, np. ATTATCG, niektóre kilka podobnych do siebie, np. ATTTA, ATTCA i ATTGA.
Bardzo istotną rolę u wszystkich organizmów pełnią białka - przenoszą substancje, przekazują sygnały, regulują wiele procesów, tworzą szkielet komórek etc. Wiele procesów wymaga tego, by zaszła jakaś interakcja między dwoma białkami. Można narysować interakcje białkowe za pomocą grafu: białka są wierzchołkami grafu; dwa białka są połączone, jeśli zaobserwowano między nimi interakcję. Analizowanie takich sieci wymaga częstego sięgania do matematyki, a konkretnie do teorii grafów.