Kto objavil genetický kód. Degenerácia genetického kódu: všeobecné informácie


Genetický kód sa zvyčajne chápe ako systém znakov označujúcich sekvenčné usporiadanie nukleotidových zlúčenín v DNA a RNA, čo zodpovedá inému znakovému systému zobrazujúcemu sekvenciu zlúčenín aminokyselín v molekule proteínu.

Toto je dôležité!

Keď sa vedcom podarilo študovať vlastnosti genetického kódu, univerzálnosť bola uznaná za jednu z hlavných. Áno, nech to znie akokoľvek zvláštne, všetko spája jeden, univerzálny, spoločný genetický kód. Vznikol počas dlhého časového obdobia a proces sa skončil asi pred 3,5 miliardami rokov. Následne možno v štruktúre kódu vysledovať stopy jeho vývoja, od jeho vzniku až po súčasnosť.

Keď hovoríme o postupnosti usporiadania prvkov v genetickom kóde, máme na mysli, že zďaleka nie je chaotické, ale má prísne definované poradie. A to do značnej miery určuje aj vlastnosti genetického kódu. To je ekvivalentné usporiadaniu písmen a slabík v slovách. Akonáhle porušíme zaužívaný poriadok, väčšina z toho, čo čítame na stránkach kníh alebo novín, sa premení na smiešny gýč.

Základné vlastnosti genetického kódu

Zvyčajne kód obsahuje niektoré informácie zašifrované špeciálnym spôsobom. Aby ste kód rozlúštili, musíte poznať charakteristické črty.

Takže hlavné vlastnosti genetického kódu sú:

  • trojnásobnosť;
  • degenerácia alebo nadbytočnosť;
  • jednoznačnosť;
  • kontinuita;
  • už spomenutá všestrannosť.

Pozrime sa bližšie na každú nehnuteľnosť.

1. Trojnásobok

To je, keď tri nukleotidové zlúčeniny tvoria sekvenčný reťazec v molekule (t. j. DNA alebo RNA). V dôsledku toho sa vytvorí tripletová zlúčenina alebo kóduje jednu z aminokyselín, jej umiestnenie v peptidovom reťazci.

Kodóny (to sú tiež kódové slová!) sa rozlišujú podľa poradia spojení a podľa typu tých dusíkatých zlúčenín (nukleotidov), ktoré sú ich súčasťou.

V genetike je zvykom rozlišovať 64 typov kodónov. Môžu tvoriť kombinácie štyroch typov nukleotidov, 3 v každom. To je ekvivalentné zvýšeniu čísla 4 na tretiu mocninu. Je teda možná tvorba 64 nukleotidových kombinácií.

2. Redundancia genetického kódu

Táto vlastnosť sa pozoruje, keď je potrebných niekoľko kodónov na zakódovanie jednej aminokyseliny, zvyčajne v rozsahu 2-6. A iba tryptofán môže byť zakódovaný pomocou jedného tripletu.

3. Jednoznačnosť

Je zahrnutý vo vlastnostiach genetického kódu ako indikátor zdravej genetickej dedičnosti. Napríklad triplet GAA, ktorý je v reťazci na šiestom mieste, môže lekárom povedať o dobrom stave krvi, o normálnom hemoglobíne. Práve on nesie informáciu o hemoglobíne a je ním aj zakódovaná A ak má človek anémiu, jeden z nukleotidov je nahradený iným písmenom kódu – U, čo je signál choroby.

4. Kontinuita

Pri zaznamenávaní tejto vlastnosti genetického kódu treba pamätať na to, že kodóny, podobne ako články v reťazci, nie sú umiestnené vo vzdialenosti, ale v priamej blízkosti, jeden po druhom v reťazci nukleovej kyseliny a tento reťazec nie je prerušený - nemá začiatok ani koniec.

5. Všestrannosť

Nikdy by sme nemali zabúdať, že všetko na Zemi spája spoločný genetický kód. A preto u primátov a ľudí, u hmyzu a vtákov, v storočnom baobabe a steblo trávy, ktoré sa sotva vynorilo zo zeme, sú podobné triplety zakódované podobnými aminokyselinami.

Práve v génoch sú obsiahnuté základné informácie o vlastnostiach konkrétneho organizmu, akýsi program, ktorý organizmus preberá od tých, ktorí žili skôr a ktorý existuje ako genetický kód.

GENETICKÝ KÓD(grécky, genetikos týkajúci sa pôvodu; syn.: kód, biologický kód, kód aminokyseliny, kód proteínu, kód nukleovej kyseliny) - systém na zaznamenávanie dedičnej informácie v molekulách nukleových kyselín zvierat, rastlín, baktérií a vírusov striedaním sekvencií nukleotidov.

Genetická informácia (obr.) z bunky do bunky, z generácie na generáciu, s výnimkou RNA vírusov, sa prenáša reduplikáciou molekúl DNA (pozri Replikácia). Implementácia DNA dedičnej informácie počas života bunky sa uskutočňuje prostredníctvom 3 typov RNA: informačnej (mRNA alebo mRNA), ribozomálnej (rRNA) a transportnej (tRNA), ktoré sú syntetizované pomocou enzýmu RNA polymerázy na DNA ako matice. V tomto prípade sekvencia nukleotidov v molekule DNA jednoznačne určuje sekvenciu nukleotidov vo všetkých troch typoch RNA (pozri Transkripcia). Informáciu génu (pozri), kódujúceho molekulu proteínu, prenáša iba mRNA. Konečným produktom implementácie dedičnej informácie je syntéza proteínových molekúl, ktorých špecifickosť je určená sekvenciou aminokyselín v nich obsiahnutých (pozri preklad).

Keďže DNA alebo RNA obsahuje iba 4 rôzne dusíkaté bázy [v DNA - adenín (A), tymín (T), guanín (G), cytozín (C); v RNA - adenín (A), uracil (U), cytozín (C), guanín (G)], ktorých sekvencia určuje poradie 20 aminokyselín v bielkovine, vzniká problém GK, teda problém transl. 4-písmenová abeceda nukleových kyselín do 20-písmenovej abecedy polypeptidov.

Prvýkrát myšlienku matricovej syntézy proteínových molekúl so správnou predpoveďou vlastností hypotetickej matrice sformuloval N. K. Koltsov v roku 1928. V roku 1944 O. Avery a kol prenos dedičných charakteristík počas transformácie u pneumokokov. V roku 1948 E. Chargaff ukázal, že vo všetkých molekulách DNA existuje kvantitatívna rovnosť zodpovedajúcich nukleotidov (A-T, G-C). V roku 1953 F. Crick, J. Watson a Wilkins (M. H. F. Wilkins) na základe tohto pravidla a údajov o röntgenovej difrakcii (pozri) dospeli k záveru, že molekuly DNA sú dvojitá špirála pozostávajúca z dvoch polynukleotidových vlákien spojených s každým iné vodíkovými väzbami. Navyše iba T môže byť proti A jedného reťazca v druhom a iba C môže byť proti G. Táto komplementarita vedie k tomu, že sekvencia nukleotidov jedného reťazca jednoznačne určuje sekvenciu druhého reťazca. Druhý významný záver, ktorý vyplýva z tohto modelu, je, že molekula DNA je schopná samoreprodukcie.

V roku 1954 G. Gamow sformuloval problém geometrických rovníc v jeho modernej podobe. V roku 1957 F. Crick vyjadril hypotézu o adaptore, ktorá naznačuje, že aminokyseliny interagujú s nukleovou kyselinou nie priamo, ale prostredníctvom sprostredkovateľov (teraz známych ako tRNA). V nasledujúcich rokoch sa experimentálne potvrdili všetky základné súvislosti vo všeobecnej schéme prenosu genetickej informácie, pôvodne hypotetické. V roku 1957 boli objavené mRNA [A. S. Spirin, A. N. Belozersky a kol.; Folkin a Astrachan (E. Volkin, L. Astrachan)] a tRNA [Hoagland (M.V. Hoagland)]; v roku 1960 bola DNA syntetizovaná mimo bunky pomocou existujúcich makromolekúl DNA ako matrice (A. Kornberg) a bola objavená DNA-dependentná syntéza RNA [S. V roku 1961 bol vytvorený bezbunkový systém, v ktorom boli syntetizované látky podobné proteínom v prítomnosti prirodzenej RNA alebo syntetických polyribonukleotidov [M. Nirenberg a Matthaei (J. H. Matthaei)]. Problém poznania kódu spočíval v štúdiu všeobecných vlastností kódu a jeho vlastne dešifrovaní, teda zistení, ktoré kombinácie nukleotidov (kodónov) kódujú určité aminokyseliny.

Všeobecné vlastnosti kódu boli objasnené nezávisle od jeho dekódovania a hlavne pred ním analýzou molekulárnych vzorcov tvorby mutácií (F. Krick a kol., 1961; N. V. Luchnik, 1963). Zredukujú sa na nasledovné:

1. Kód je univerzálny, teda identický, aspoň v zásade, pre všetky živé bytosti.

2. Kód je triplet, to znamená, že každá aminokyselina je kódovaná tripletom nukleotidov.

3. Kód sa neprekrýva, t.j. daný nukleotid nemôže byť súčasťou viac ako jedného kodónu.

4. Kód je degenerovaný, t.j. jedna aminokyselina môže byť kódovaná niekoľkými tripletmi.

5. Informácie o primárnej štruktúre proteínu sa čítajú z mRNA postupne, začínajúc od pevného bodu.

6. Väčšina možných tripletov má „zmysel“, to znamená, že kódujú aminokyseliny.

7. Z troch „písmen“ kodónu iba dve (obligátne) majú prevládajúci význam, zatiaľ čo tretie (voliteľné) nesie podstatne menej informácií.

Priame dekódovanie kódu by pozostávalo z porovnania nukleotidovej sekvencie v štruktúrnom géne (alebo na ňom syntetizovanej mRNA) s aminokyselinovou sekvenciou v zodpovedajúcom proteíne. Takáto cesta však zatiaľ nie je technicky možná. Boli použité ďalšie dva spôsoby: syntéza proteínov v bezbunkovom systéme s použitím umelých polyribonukleotidov známeho zloženia ako matrice a analýza molekulárnych vzorcov tvorby mutácií (pozri). Prvý priniesol pozitívne výsledky skôr a historicky zohral veľkú úlohu pri rozlúštení G. k.

V roku 1961 M. Nirenberg a Mattei použili ako matricu homopolymér - syntetickú kyselinu polyuridylovú (t. j. umelú RNA v zložení UUUU...) a získali polyfenylalanín. Z toho vyplýva, že fenylalanínový kodón pozostáva z niekoľkých U, t.j. v prípade tripletového kódu sa dešifruje ako UUU. Neskôr sa spolu s homopolymérmi začali používať polyribonukleotidy pozostávajúce z rôznych nukleotidov. Súčasne bolo známe iba zloženie polymérov, umiestnenie nukleotidov v nich bolo štatistické, preto analýza výsledkov bola štatistická a poskytovala nepriame závery. Pomerne rýchlo sa podarilo nájsť aspoň jeden triplet pre všetkých 20 aminokyselín. Ukázalo sa, že prítomnosť organických rozpúšťadiel, zmeny pH alebo teploty, niektoré katióny a najmä antibiotiká spôsobujú, že kód je nejednoznačný: rovnaké kodóny začnú stimulovať inklúziu iných aminokyselín, v niektorých prípadoch jeden kodón začal kódovať až štyri rôzne aminokyseliny. Streptomycín ovplyvnil čítanie informácií v bezbunkových systémoch aj in vivo a bol účinný len na bakteriálne kmene citlivé na streptomycín. V kmeňoch závislých od streptomycínu „opravil“ čítanie z kodónov, ktoré sa zmenili v dôsledku mutácie. Podobné výsledky dali dôvod pochybovať o správnosti G. dekódovania pomocou bezbunkového systému; bolo potrebné potvrdenie, predovšetkým údajmi in vivo.

Hlavné údaje o G. in vivo sa získali analýzou zloženia aminokyselín proteínov v organizmoch ošetrených mutagénmi (pozri) so známym mechanizmom účinku, napríklad dusíkom, ktorý spôsobuje nahradenie C za U a A za in molekula DNA D. Užitočné informácie poskytuje aj analýza mutácií spôsobených nešpecifickými mutagénmi, porovnanie rozdielov v primárnej štruktúre príbuzných proteínov u rôznych druhov, korelácia medzi zložením DNA a proteínmi atď.

Dešifrovanie G. to na základe údajov in vivo a in vitro poskytlo zodpovedajúce výsledky. Neskôr boli vyvinuté tri ďalšie metódy na dešifrovanie kódu v bezbunkových systémoch: väzba aminoacyl-tRNA (t. j. tRNA s pripojenou aktivovanou aminokyselinou) s trinukleotidmi známeho zloženia (M. Nirenberg et al., 1965), väzba aminoacyl-tRNA s polynukleotidmi počínajúc určitým tripletom (Mattei a kol., 1966) a použitie polymérov ako mRNA, v ktorých je známe nielen zloženie, ale aj poradie nukleotidov (X. Korana a kol. , 1965). Všetky tri metódy sa navzájom dopĺňajú a výsledky sú v súlade s údajmi získanými z experimentov in vivo.

V 70. rokoch 20. storočia sa objavili metódy na obzvlášť spoľahlivé overenie výsledkov dekódovania G. k. Je známe, že mutácie, ktoré sa vyskytujú pod vplyvom proflavínu, pozostávajú zo straty alebo inzercie jednotlivých nukleotidov, čo vedie k posunu v čítacom rámci. Vo fágu T4 spôsobil proflavín množstvo mutácií, pri ktorých sa zmenilo zloženie lyzozýmu. Toto zloženie sa analyzovalo a porovnalo s tými kodónmi, ktoré by mali byť výsledkom posunu rámca. Výsledkom bola úplná zhoda. Okrem toho táto metóda umožnila zistiť, ktoré triplety degenerovaného kódu kódujú každú z aminokyselín. V roku 1970 sa J. M. Adamsovi a jeho spolupracovníkom podarilo čiastočne dešifrovať G. c priamou metódou: vo fágu R17 sa určila sekvencia báz vo fragmente s dĺžkou 57 nukleotidov a porovnala sa s aminokyselinovou sekvenciou jeho obalového proteínu. . Výsledky boli úplne v súlade s výsledkami získanými menej priamymi metódami. Kód bol teda dešifrovaný úplne a správne.

Výsledky dekódovania sú zhrnuté v tabuľke. Označuje zloženie kodónov a RNA. Zloženie antikodónov tRNA je komplementárne ku kodónom mRNA, t.j. namiesto Y obsahujú A, namiesto A - U, namiesto C - G a namiesto G - C, a zodpovedá kodónom štruktúrneho génu (vlákno DNA z ktorého sa informácie čítajú) len s tým rozdielom, že uracil zaberá miesto tymínu. Zo 64 tripletov, ktoré môžu byť vytvorené kombináciou 4 nukleotidov, 61 má „zmysel“, t. j. kóduje aminokyseliny, a 3 sú „nezmyselné“ (bezvýznamné). Medzi zložením trojíc a ich významom existuje pomerne jasný vzťah, ktorý sa zistil pri analýze všeobecných vlastností kódu. V niektorých prípadoch sú triplety kódujúce špecifickú aminokyselinu (napríklad prolín, alanín) charakterizované skutočnosťou, že prvé dva nukleotidy (obligátne) sú rovnaké a tretí (voliteľný) môže byť čokoľvek. V iných prípadoch (pri kódovaní napr. asparagínu, glutamínu) majú rovnaký význam dva podobné triplety, v ktorých sa prvé dva nukleotidy zhodujú a na mieste tretieho je akýkoľvek purín alebo akýkoľvek pyrimidín.

Nezmyselné kodóny, z ktorých 2 majú špeciálne názvy zodpovedajúce označeniu fágových mutantov (UAA-okrová, UAG-jantárová, UGA-opálová), hoci nekódujú žiadne aminokyseliny, majú veľký význam pri čítaní informácií, kódujúcich koniec polypeptidového reťazca.

Čítanie informácií prebieha v smere od 5 1 -> 3 1 - ku koncu nukleotidového reťazca (pozri Deoxyribonukleové kyseliny). V tomto prípade syntéza proteínov postupuje od aminokyseliny s voľnou aminoskupinou k aminokyseline s voľnou karboxylovou skupinou. Začiatok syntézy je kódovaný tripletmi AUG a GUG, ktoré v tomto prípade zahŕňajú špecifickú východiskovú aminoacyl-tRNA, konkrétne N-formylmetionyl-tRNA. Tieto isté triplety, keď sú lokalizované v reťazci, kódujú metionín a valín. Nejednoznačnosť odstraňuje fakt, že začiatku čítania predchádza nezmysel. Existuje dôkaz, že hranica medzi oblasťami mRNA kódujúcich rôzne proteíny pozostáva z viac ako dvoch tripletov a že sekundárna štruktúra RNA sa v týchto miestach mení; táto problematika je predmetom výskumu. Ak sa v štrukturálnom géne vyskytne nezmyselný kodón, potom sa zodpovedajúci proteín vytvorí iba po umiestnenie tohto kodónu.

Objav a rozlúštenie genetického kódu - vynikajúci úspech molekulárnej biológie - ovplyvnilo všetky biologické vedy, v niektorých prípadoch znamenalo začiatok vývoja špeciálnych veľkých sekcií (pozri Molekulárna genetika). Účinok G. objavu a súvisiaceho výskumu sa porovnáva s účinkom, ktorý mala Darwinova teória na biologické vedy.

Univerzálnosť genetiky je priamym dôkazom univerzálnosti základných molekulárnych mechanizmov života u všetkých predstaviteľov organického sveta. Medzitým veľké rozdiely vo funkciách genetického aparátu a jeho štruktúre pri prechode z prokaryotov na eukaryoty a z jednobunkových na mnohobunkové organizmy sú pravdepodobne spojené s molekulárnymi rozdielmi, ktorých štúdium je jednou z úloh budúcnosti. Keďže G. výskum je len záležitosťou posledných rokov, význam získaných výsledkov pre praktickú medicínu je len nepriamy, čo nám umožňuje pochopiť podstatu chorôb a mechanizmus účinku patogénov a liečivých látok. Objav takých javov, ako je transformácia (pozri), transdukcia (pozri), potlačenie (pozri), však naznačuje zásadnú možnosť nápravy patologicky zmenenej dedičnej informácie alebo jej korekcie – tzv. genetické inžinierstvo (pozri).

Tabuľka. GENETICKÝ KÓD

Prvý nukleotid kodónu

Druhý nukleotid kodónu

Po tretie, nukleotidový kodón

fenylalanín

J Nezmysel

tryptofán

histidín

Kyselina glutámová

izoleucín

Aspartát

metionín

Asparagín

Glutamín

* Kóduje koniec reťazca.

** Kóduje aj začiatok reťazca.

Bibliografia: Ichas M. Biologický kód, prekl. z angličtiny, M., 1971; Archer N.B. Biofyzika cytogenetických lézií a genetický kód, L., 1968; Molekulárna genetika, trans. z angličtiny, vyd. A. N. Belozersky, časť 1, M., 1964; Nukleové kyseliny, trans. z angličtiny, vyd. A. N. Belozersky, M., 1965; Watson J.D. Molekulárna biológia génu, trans. z angličtiny, M., 1967; Fyziologická genetika, vyd. M. E. Lobasheva S.G., Inge-Vechtomo-va, L., 1976, bibliogr.; Desoxyribonuc-leins&ure, Schlttssel des Lebens, hrsg. v„E. Geissler, B., 1972; Genetický kód, Gold Spr. Harb. Symp. kvant. Biol., v. 31, 1966; W o e s e C. R. Genetický kód, N. Y. a. o., 1967.

GENETICKÝ KÓD, systém na zaznamenávanie dedičnej informácie vo forme sekvencie nukleotidových báz v molekulách DNA (u niektorých vírusov - RNA), ktorý určuje primárnu štruktúru (umiestnenie aminokyselinových zvyškov) v molekulách bielkovín (polypeptidoch). Problém genetického kódu bol formulovaný po preukázaní genetickej úlohy DNA (americkí mikrobiológovia O. Avery, K. McLeod, M. McCarthy, 1944) a rozlúštení jej štruktúry (J. Watson, F. Crick, 1953), po zistení že gény určujú štruktúru a funkcie enzýmov (princíp „jeden gén – jeden enzým“ od J. Beadle a E. Tatem, 1941) a že existuje závislosť priestorovej štruktúry a aktivity proteínu od jeho primárnej štruktúry (F. Sanger, 1955). Otázku, ako kombinácie 4 báz nukleových kyselín určujú striedanie 20 bežných aminokyselinových zvyškov v polypeptidoch, prvýkrát položil G. Gamow v roku 1954.

Na základe experimentu, v ktorom študovali interakcie inzercií a delécií páru nukleotidov v jednom z génov bakteriofága T4, F. Crick a ďalší vedci v roku 1961 určili všeobecné vlastnosti genetického kódu: tripletitu, t.j. každý aminokyselinový zvyšok v polypeptidovom reťazci zodpovedá súboru troch báz (triplet alebo kodón) v DNA génu; kodóny v géne sa čítajú z pevného bodu, v jednom smere a „bez čiarok“, to znamená, že kodóny nie sú od seba oddelené žiadnymi znakmi; degenerácia, alebo redundancia – ten istý aminokyselinový zvyšok môže byť kódovaný niekoľkými kodónmi (synonymnými kodónmi). Autori predpokladali, že kodóny sa neprekrývajú (každá báza patrí len jednému kodónu). Priame štúdium kódovacej kapacity tripletov pokračovalo pomocou systému bezbunkovej syntézy proteínov pod kontrolou syntetickej mediátorovej RNA (mRNA). Do roku 1965 bol genetický kód úplne rozlúštený v prácach S. Ochoa, M. Nirenberga a H. G. Korana. Odhalenie tajomstiev genetického kódu bolo jedným z vynikajúcich úspechov biológie 20. storočia.

Implementácia genetického kódu v bunke prebieha počas dvoch matricových procesov – transkripcie a translácie. Mediátorom medzi génom a proteínom je mRNA, ktorá vzniká pri transkripcii na jednom z reťazcov DNA. V tomto prípade je sekvencia báz DNA, ktorá nesie informácie o primárnej štruktúre proteínu, „prepísaná“ do podoby sekvencie báz mRNA. Potom, počas translácie na ribozómoch, je nukleotidová sekvencia mRNA čítaná transferovými RNA (tRNA). Tieto majú akceptorový koniec, ku ktorému je pripojený aminokyselinový zvyšok, a adaptorový koniec alebo antikodónový triplet, ktorý rozpoznáva zodpovedajúci mRNA kodón. K interakcii kodónu a antikodónu dochádza na základe komplementárneho párovania báz: adenín (A) - uracil (U), guanín (G) - cytozín (C); v tomto prípade je sekvencia báz mRNA translatovaná do sekvencie aminokyselín syntetizovaného proteínu. Rôzne organizmy používajú rôzne synonymné kodóny s rôznymi frekvenciami pre rovnakú aminokyselinu. Čítanie mRNA kódujúcej polypeptidový reťazec začína (iniciuje) kodónom AUG zodpovedajúcim aminokyseline metionínu. Menej často sú u prokaryotov iniciačnými kodónmi GUG (valín), UUG (leucín), AUU (izoleucín) a u eukaryotov - UUG (leucín), AUA (izoleucín), ACG (treonín), CUG (leucín). Toto nastaví takzvaný rámec alebo fázu čítania počas translácie, to znamená, že potom sa celá nukleotidová sekvencia mRNA prečíta triplet po triplete tRNA, až kým sa nenarazí na niektorý z troch terminačných kodónov, často nazývaných stop kodóny. mRNA: UAA, UAG, UGA (tabuľka). Čítanie týchto tripletov vedie k dokončeniu syntézy polypeptidového reťazca.

AUG a stop kodóny sa objavujú na začiatku a na konci oblastí mRNA kódujúcich polypeptidy.

Genetický kód je kvázi univerzálny. To znamená, že existujú malé rozdiely vo význame niektorých kodónov medzi objektmi, a to platí predovšetkým pre terminátorové kodóny, ktoré môžu byť významné; napríklad v mitochondriách niektorých eukaryotov a mykoplazmov kóduje UGA tryptofán. Okrem toho v niektorých mRNA baktérií a eukaryotov kóduje UGA nezvyčajnú aminokyselinu - selenocysteín a UAG v jednej z archebaktérií - pyrolyzín.

Existuje názor, podľa ktorého genetický kód vznikol náhodou (hypotéza „zamrznutej náhody“). Je pravdepodobnejšie, že sa to vyvinulo. Tento predpoklad podporuje existencia jednoduchšej a zjavne staršej verzie kódu, ktorý sa číta v mitochondriách podľa pravidla „dva z troch“, keď aminokyselinu určujú iba dve z troch báz. v trojke.

Lit.: Crick F. N. a. O. Všeobecná povaha genetického kódu pre proteíny // Príroda. 1961. Zv. 192; Genetický kód. N.Y., 1966; Ichas M. Biologický kód. M., 1971; Inge-Vechtomov S.G. Ako sa číta genetický kód: pravidlá a výnimky // Moderná prírodná veda. M., 2000. T. 8; Ratner V. A. Genetický kód ako systém // Sorosov vzdelávací časopis. 2000. T. 6. č. 3.

S. G. Inge-Vechtomov.

Klasifikácia génov

1) Podľa povahy interakcie v alelickom páre:

Dominantný (gén schopný potlačiť prejav recesívneho génu, alelického k nemu); - recesívny (gén, ktorého expresia je potlačená jeho alelickým dominantným génom).

2) Funkčná klasifikácia:

2) Genetický kód- sú to určité kombinácie nukleotidov a sekvencia ich umiestnenia v molekule DNA. Toto je metóda charakteristická pre všetky živé organizmy kódovania aminokyselinovej sekvencie proteínov pomocou sekvencie nukleotidov.

DNA využíva štyri nukleotidy - adenín (A), guanín (G), cytozín (C), tymín (T), ktoré sa v ruskej literatúre označujú písmenami A, G, T a C. Tieto písmená tvoria abecedu tzv. genetický kód. RNA používa rovnaké nukleotidy, s výnimkou tymínu, ktorý je nahradený podobným nukleotidom – uracilom, ktorý je označený písmenom U (v ruskojazyčnej literatúre U). V molekulách DNA a RNA sú nukleotidy usporiadané do reťazcov a tak sa získajú sekvencie genetických písmen.

Genetický kód

Na vytvorenie bielkovín v prírode sa používa 20 rôznych aminokyselín. Každý proteín je reťazec alebo niekoľko reťazcov aminokyselín v presne definovanom poradí. Táto sekvencia určuje štruktúru proteínu, a tým aj všetky jeho biologické vlastnosti. Súbor aminokyselín je tiež univerzálny pre takmer všetky živé organizmy.

Implementácia genetickej informácie v živých bunkách (t. j. syntéza proteínu kódovaného génom) sa uskutočňuje pomocou dvoch matricových procesov: transkripcia (tj syntéza mRNA na matrici DNA) a translácia genetického kódu. do aminokyselinovej sekvencie (syntéza polypeptidového reťazca na matrici mRNA). Tri po sebe idúce nukleotidy sú dostatočné na kódovanie 20 aminokyselín, ako aj stop signál označujúci koniec proteínovej sekvencie. Súbor troch nukleotidov sa nazýva triplet. Akceptované skratky zodpovedajúce aminokyselinám a kodónom sú znázornené na obrázku.

Vlastnosti genetického kódu

1. Triplety- zmysluplná jednotka kódu je kombináciou troch nukleotidov (triplet alebo kodón).

2. Kontinuita- medzi trojicami nie sú žiadne interpunkčné znamienka, to znamená, že informácie sa čítajú nepretržite.

3. Diskrétnosť- ten istý nukleotid nemôže byť súčasťou dvoch alebo viacerých tripletov súčasne.

4. Špecifickosť- špecifický kodón zodpovedá len jednej aminokyseline.

5. Degenerácia (redundancia)- niekoľko kodónov môže zodpovedať tej istej aminokyseline.

6. Všestrannosť - genetický kód funguje rovnako v organizmoch rôznej úrovne zložitosti – od vírusov až po ľudí. (na tomto sú založené metódy genetického inžinierstva)

3) prepis - proces syntézy RNA pomocou DNA ako templátu, ktorý sa vyskytuje vo všetkých živých bunkách. Inými slovami, ide o prenos genetickej informácie z DNA do RNA.

Transkripcia je katalyzovaná enzýmom DNA-dependentným RNA polymerázou. Proces syntézy RNA prebieha v smere od 5" do 3" konca, to znamená, že pozdĺž vlákna templátu DNA sa RNA polymeráza pohybuje v smere 3"->5"

Transkripcia pozostáva z fáz iniciácie, predĺženia a ukončenia.

Iniciácia transkripcie- zložitý proces, ktorý závisí od sekvencie DNA v blízkosti transkribovanej sekvencie (a u eukaryotov aj od vzdialenejších častí genómu - zosilňovačov a tlmičov) a od prítomnosti alebo neprítomnosti rôznych proteínových faktorov.

Predĺženie- pokračuje ďalšie odvíjanie DNA a syntéza RNA pozdĺž kódovacieho reťazca. rovnako ako syntéza DNA prebieha v smere 5-3

Ukončenie- akonáhle polymeráza dosiahne terminátor, okamžite sa odštiepi od DNA, lokálny hybrid DNA-RNA je zničený a novosyntetizovaná RNA je transportovaná z jadra do cytoplazmy a transkripcia je dokončená.

Spracovanie- súbor reakcií vedúcich k premene primárnych produktov transkripcie a translácie na funkčné molekuly. Funkčne neaktívne prekurzorové molekuly sú vystavené P. ribonukleové kyseliny (tRNA, rRNA, mRNA) a mnohé ďalšie. bielkoviny.

V procese syntézy katabolických enzýmov (rozklad substrátov) dochádza u prokaryotov k indukovateľnej syntéze enzýmov. To dáva bunke príležitosť prispôsobiť sa podmienkam prostredia a šetriť energiu zastavením syntézy zodpovedajúceho enzýmu, ak jeho potreba zmizne.
Na vyvolanie syntézy katabolických enzýmov sú potrebné nasledujúce podmienky:

1. Enzým sa syntetizuje iba vtedy, keď je pre bunku nevyhnutný rozklad zodpovedajúceho substrátu.
2. Pred vytvorením zodpovedajúceho enzýmu musí koncentrácia substrátu v médiu prekročiť určitú úroveň.
Mechanizmus regulácie génovej expresie v Escherichia coli je najlepšie preštudovaný na príklade lac operónu, ktorý riadi syntézu troch katabolických enzýmov, ktoré štiepia laktózu. Ak je v bunke veľa glukózy a málo laktózy, promótor zostáva neaktívny a represorový proteín sa nachádza na operátorovi - transkripcia lac operónu je blokovaná. Keď množstvo glukózy v médiu, a teda aj v bunke, klesá a laktóza stúpa, dochádza k nasledujúcim udalostiam: zvyšuje sa množstvo cyklického adenozínmonofosfátu, ten sa viaže na proteín CAP – tento komplex aktivuje promótor, na ktorý sa RNA polymeráza viaže; zároveň sa nadbytočná laktóza naviaže na represorový proteín a uvoľní z neho operátor – uvoľní sa cesta pre RNA polymerázu, začína sa prepis štruktúrnych génov lac operónu. Laktóza pôsobí ako induktor syntézy tých enzýmov, ktoré ju rozkladajú.

5) Regulácia génovej expresie v eukaryotoch je oveľa zložitejšia. Rôzne typy buniek mnohobunkového eukaryotického organizmu syntetizujú množstvo identických proteínov a zároveň sa navzájom líšia súborom proteínov špecifických pre bunky daného typu. Úroveň produkcie závisí od typu bunky, ako aj od štádia vývoja organizmu. Regulácia génovej expresie prebieha na bunkovej a organizačnej úrovni. Gény eukaryotických buniek sa delia na dve hlavné typy: prvý určuje univerzálnosť bunkových funkcií, druhý určuje (určuje) špecializované bunkové funkcie. Génové funkcie prvá skupina objaviť vo všetkých bunkách. Aby mohli vykonávať diferencované funkcie, musia špecializované bunky exprimovať špecifický súbor génov.
Chromozómy, gény a operóny eukaryotických buniek majú množstvo štrukturálnych a funkčných znakov, čo vysvetľuje zložitosť génovej expresie.
1. Operóny eukaryotických buniek majú viacero génov – regulátorov, ktoré sa môžu nachádzať na rôznych chromozómoch.
2. Štrukturálne gény, ktoré riadia syntézu enzýmov jedného biochemického procesu, môžu byť sústredené vo viacerých operónoch, nachádzajúcich sa nielen v jednej molekule DNA, ale aj vo viacerých.
3. Komplexná sekvencia molekuly DNA. Existujú informatívne a neinformatívne časti, jedinečné a opakovane sa opakujúce informatívne nukleotidové sekvencie.
4. Eukaryotické gény pozostávajú z exónov a intrónov a dozrievanie mRNA je sprevádzané excíziou intrónov zo zodpovedajúcich primárnych transkriptov RNA (pro-RNA), t.j. spájanie.
5. Proces transkripcie génu závisí od stavu chromatínu. Lokálne zhutnenie DNA úplne blokuje syntézu RNA.
6. Transkripcia v eukaryotických bunkách nie je vždy spojená s transláciou. Syntetizovaná mRNA môže byť dlho uložená vo forme informačno-zómov. Transkripcia a translácia sa vyskytujú v rôznych kompartmentoch.
7. Niektoré eukaryotické gény majú nekonzistentnú lokalizáciu (labilné gény alebo transpozóny).
8. Metódy molekulárnej biológie odhalili inhibičný účinok histónových proteínov na syntézu mRNA.
9. Počas vývoja a diferenciácie orgánov závisí aktivita génov od hormónov, ktoré cirkulujú v tele a spôsobujú špecifické reakcie v určitých bunkách. U cicavcov je dôležité pôsobenie pohlavných hormónov.
10. V eukaryotoch je v každom štádiu ontogenézy exprimovaných 5-10% génov, zvyšok musí byť zablokovaný.

6) oprava genetického materiálu

Genetická reparácia- proces odstraňovania genetického poškodenia a obnovy dedičného aparátu, vyskytujúci sa v bunkách živých organizmov pod vplyvom špeciálnych enzýmov. Schopnosť buniek opravovať genetické poškodenia prvýkrát objavil v roku 1949 americký genetik A. Kellner. Oprava- špeciálna funkcia buniek, ktorá spočíva v schopnosti korigovať chemické poškodenia a zlomy v molekulách DNA poškodených pri normálnej biosyntéze DNA v bunke alebo v dôsledku pôsobenia fyzikálnych alebo chemických látok. Vykonáva sa špeciálnymi enzýmovými systémami bunky. Množstvo dedičných chorôb (napr. xeroderma pigmentosum) je spojených s poruchami reparačných systémov.

druhy opráv:

Priama oprava je najjednoduchší spôsob eliminácie poškodenia v DNA, ktorý zvyčajne zahŕňa špecifické enzýmy, ktoré dokážu rýchlo (zvyčajne v jednom štádiu) eliminovať zodpovedajúce poškodenie a obnoviť tak pôvodnú štruktúru nukleotidov. To je prípad napríklad O6-metylguanín DNA metyltransferázy, ktorá odstraňuje metylovú skupinu z dusíkatej bázy na jeden z vlastných cysteínových zvyškov.

Sériu článkov popisujúcich vznik Občianskeho zákonníka možno poňať ako vyšetrovanie udalostí, o ktorých máme veľa stôp. Pochopenie týchto článkov si však vyžaduje určité úsilie na pochopenie molekulárnych mechanizmov syntézy proteínov. Tento článok je úvodným pre sériu autopublikácií venovaných pôvodu genetického kódu a je tým najlepším miestom, kde sa s touto témou začať zoznamovať.
Zvyčajne genetický kód(GC) je definovaná ako metóda (pravidlo) na kódovanie proteínu na primárnej štruktúre DNA alebo RNA. V literatúre sa najčastejšie píše, že ide o jedinečnú zhodu sekvencie troch nukleotidov v géne s jednou aminokyselinou v syntetizovanom proteíne alebo koncovom bode syntézy proteínov. V tejto definícii sú však dve chyby. Ide o 20 takzvaných kanonických aminokyselín, ktoré sú súčasťou bielkovín všetkých živých organizmov bez výnimky. Tieto aminokyseliny sú proteínové monoméry. Chyby sú nasledovné:

1) Kanonických aminokyselín nie je 20, ale len 19. Aminokyselinou môžeme nazvať látku, ktorá súčasne obsahuje aminoskupinu -NH 2 a karboxylovú skupinu - COOH. Faktom je, že proteínový monomér - prolín - nie je aminokyselina, pretože obsahuje iminoskupinu namiesto aminoskupiny, preto je správnejšie nazývať prolín iminokyselinou. V budúcnosti však vo všetkých článkoch venovaných HA pre pohodlie napíšem asi 20 aminokyselín, čo znamená špecifikovanú nuanciu. Štruktúry aminokyselín sú znázornené na obr. 1.

Ryža. 1. Štruktúry kanonických aminokyselín. Aminokyseliny majú konštantné časti, označené na obrázku čiernou farbou, a variabilné časti (alebo radikály) označené červenou farbou.

2) Zhoda aminokyselín s kodónmi nie je vždy jednoznačná. Porušenie prípadov jednoznačnosti pozri nižšie.

Vznik GC znamená vznik kódovanej syntézy proteínov. Táto udalosť je jednou z kľúčových udalostí pre evolučné formovanie prvých živých organizmov.

Štruktúra HA je znázornená v kruhovej forme na obr. 2.



Ryža. 2. Genetický kód v kruhovom tvare. Vnútorný kruh je prvé písmeno kodónu, druhé kruh - druhé písmeno kodónu, tretí kruh - tretie písmeno kodónu, štvrtý kruh - označenie aminokyselín v trojpísmenovej skratke; P - polárne aminokyseliny, NP - nepolárne aminokyseliny. Pre prehľadnosť symetrie je dôležité zvolené poradie symbolov U - C - A - G .

Začnime teda popisovať hlavné vlastnosti HA.

1. Trojnásobnosť. Každá aminokyselina je kódovaná sekvenciou troch nukleotidov.

2. Prítomnosť intergénových interpunkčných znamienok. Medzigénne interpunkčné znamienka zahŕňajú sekvencie nukleových kyselín, v ktorých translácia začína alebo končí.

Preklad nemôže začať od žiadneho kodónu, ale iba od presne definovaného - počnúc. Štartovací kodón obsahuje triplet AUG, od ktorého začína translácia. V tomto prípade tento triplet kóduje buď metionín, alebo inú aminokyselinu – formylmetionín (u prokaryotov), ​​ktorú možno zaradiť len na začiatku syntézy bielkovín. Na konci každého génu kódujúceho polypeptid je aspoň jeden z 3 stop kodóny, alebo brzdové svetlá: UAA, UAG, UGA. Ukončujú transláciu (tzv. syntézu proteínov na ribozóme).

3. Kompaktnosť alebo absencia intragénnych interpunkčných znamienok. V géne je každý nukleotid súčasťou významného kodónu.

4. Neprekrývajúce sa. Kodóny sa navzájom neprekrývajú; každý má svoj vlastný usporiadaný súbor nukleotidov, ktorý sa neprekrýva s podobnými súbormi susedných kodónov.

5. Degenerácia. Opačná zhoda v smere aminokyseliny ku kodónu je nejednoznačná. Táto vlastnosť sa nazýva degenerácia. séria je súbor kodónov, ktoré kódujú jednu aminokyselinu, inými slovami, je to skupina ekvivalentné kodóny. Predstavme si kodón ako XYZ. Ak XY špecifikuje „zmysel“ (t. j. aminokyselinu), potom sa nazýva kodón silný. Ak je na určenie významu kodónu potrebné určité Z, potom sa takýto kodón nazýva slabý.

Degenerácia kódu úzko súvisí s nejednoznačnosťou párovania kodón-antikodón (antikodón znamená sekvenciu troch nukleotidov na tRNA, ktorá sa môže komplementárne párovať s kodónom na messenger RNA (podrobnejšie o tom pozri dva články: Molekulárne mechanizmy na zabezpečenie degenerácie kódu A Lagerquistovo pravidlo. Fyzikálno-chemické zdôvodnenie Rumerových symetrií a vzťahov). Jeden antikodón na tRNA dokáže rozpoznať jeden až tri kodóny na mRNA.

6.Jednoznačnosť. Každý triplet kóduje iba jednu aminokyselinu alebo je terminátorom translácie.

Sú známe tri výnimky.

Po prvé. U prokaryotov na prvej pozícii (veľké písmeno) kóduje formylmetionín a na akejkoľvek inej pozícii - metionín Na začiatku génu je formylmetionín kódovaný ako obvyklým kodónom metionínu AUG, tak aj kodónom valínu GUG alebo leucínu UUG. ktoré v géne kódujú valín a leucín.

V mnohých proteínoch sa formylmetionín odštiepi alebo sa odstráni formylová skupina, čo vedie k premene formylmetionínu na bežný metionín.

Po druhé. V roku 1986 niekoľko skupín výskumníkov zistilo, že stop kodón UGA na mRNA môže kódovať selenocysteín (pozri obr. 3), za predpokladu, že za ním nasleduje špeciálna nukleotidová sekvencia.

Ryža. 3. Štruktúra 21. aminokyseliny – selenocysteínu.

U E. coli(toto je latinský názov pre Escherichia coli) selenocysteyl-tRNA počas translácie rozpoznáva kodón UGA v mRNA, ale len v určitom kontexte: aby bol kodón UGA rozpoznaný ako zmysluplný, sekvencia s dĺžkou 45 nukleotidov umiestnená za UGA kodón je dôležitý.

Uvažovaný príklad ukazuje, že v prípade potreby môže živý organizmus zmeniť význam štandardného genetického kódu. V tomto prípade je genetická informácia obsiahnutá v génoch zakódovaná zložitejším spôsobom. Význam kodónu je určený v kontexte špecifickej rozšírenej nukleotidovej sekvencie a za účasti niekoľkých vysoko špecifických proteínových faktorov. Je dôležité, že selenocysteín ​​tRNA bol nájdený u predstaviteľov všetkých troch vetiev života (archaea, eubaktérie a eukaryoty), čo naznačuje staroveký pôvod syntézy selenocysteínu a jeho možnú prítomnosť u posledného univerzálneho spoločného predka (ktorý bude bude diskutované v iných článkoch). Selenocysteín sa s najväčšou pravdepodobnosťou nachádza vo všetkých živých organizmoch bez výnimky. Ale v akomkoľvek organizme sa selenocysteín nenachádza vo viac ako desiatkach proteínov. Je súčasťou aktívnych centier enzýmov, v mnohých homológoch, ktorých bežný cysteín môže fungovať v podobnej polohe.

Až donedávna sa verilo, že kodón UGA možno čítať buď ako selenocysteín, alebo terminál, ale nedávno sa ukázalo, že u nálevníkov Euplotes Kodón UGA kóduje buď cysteín alebo selenocysteín. Cm." Genetický kód umožňuje nezrovnalosti"

Tretia výnimka. Niektoré prokaryoty (5 druhov archaea a jedna eubaktéria – informácie na Wikipédii sú veľmi zastarané) obsahujú špeciálnu kyselinu – pyrolyzín (obr. 4). Je kódovaný UAG tripletom, ktorý v kanonickom kóde slúži ako terminátor prekladu. Predpokladá sa, že v tomto prípade, podobne ako v prípade kódovania selenocysteínu, sa čítanie UAG ako pyrolyzínového kodónu vyskytuje v dôsledku špeciálnej štruktúry na mRNA. Pyrrolyzínová tRNA obsahuje antikodón CTA a je aminoacylovaná ARSázami triedy 2 (klasifikácia ARSáz nájdete v článku „Kodázy pomáhajú pochopiť, ako genetický kód ").

UAG sa zriedka používa ako stop kodón a keď sa používa, často za ním nasleduje ďalší stop kodón.

Ryža. 4. Štruktúra 22. aminokyseliny pyrolyzínu.

7. Všestrannosť. Po dokončení dešifrovania Občianskeho zákonníka v polovici 60. rokov minulého storočia sa dlho verilo, že kód je vo všetkých organizmoch rovnaký, čo poukazuje na jednotu pôvodu všetkého života na Zemi.

Skúsme pochopiť, prečo je Občiansky zákonník univerzálny. Faktom je, že ak by sa v tele zmenilo aspoň jedno kódovacie pravidlo, viedlo by to k zmene štruktúry významnej časti bielkovín. Takáto zmena by bola príliš drastická a preto takmer vždy smrteľná, pretože zmena významu len jedného kodónu môže ovplyvniť v priemere 1/64 všetkých aminokyselinových sekvencií.

To vedie k jednej veľmi dôležitej myšlienke – GC sa od svojho vzniku pred viac ako 3,5 miliardami rokov takmer nezmenila. To znamená, že jeho štruktúra nesie stopu svojho pôvodu a analýza tejto štruktúry môže pomôcť presne pochopiť, ako mohla GC vzniknúť.

V skutočnosti sa HA môže trochu líšiť v baktériách, mitochondriách, jadrovom kóde niektorých nálevníkov a kvasinkách. V súčasnosti existuje minimálne 17 genetických kódov, ktoré sa líšia od kanonického o 1-5 kodónov Celkovo sa vo všetkých známych variantoch odchýlok od univerzálneho GK používa 18 rôznych zámen významu kodónu. Najviac odchýlok od štandardného kódu je známych pre mitochondrie - 10. Je pozoruhodné, že mitochondrie stavovcov, plochých červov a ostnatokožcov sú kódované rôznymi kódmi, zatiaľ čo plesňové huby, prvoky a coelenteráty sú kódované jedným kódom.

Evolučná blízkosť druhov vôbec nezaručuje, že majú podobné GC. Genetické kódy sa môžu líšiť aj medzi rôznymi druhmi mykoplazmy (niektoré druhy majú kanonický kód, zatiaľ čo iné sa líšia). Podobná situácia je pozorovaná pre kvasinky.

Je dôležité poznamenať, že mitochondrie sú potomkami symbiotických organizmov, ktoré sa prispôsobili životu vo vnútri buniek. Majú značne zredukovaný genóm, niektoré gény sa presunuli do bunkového jadra. Preto zmeny HA u nich už nie sú také dramatické.

Výnimky objavené neskôr sú obzvlášť zaujímavé z evolučného hľadiska, pretože môžu pomôcť objasniť mechanizmy vývoja kódu.

Tabuľka 1.

Mitochondriálne kódy v rôznych organizmoch.

Codon

Univerzálny kód

Mitochondriálne kódy

Stavovce

Bezstavovce

Kvasnice

Rastliny

U.G.A.

STOP

Trp

Trp

Trp

STOP

AUA

Ile

Met

Met

Met

Ile

CUA

Leu

Leu

Leu

Thr

Leu

A.G.A.

Arg

STOP

Ser

Arg

Arg

AGG

Arg

STOP

Ser

Arg

Arg

Tri mechanizmy na zmenu aminokyseliny kódovanej kódom.

Prvým je, keď určitý kodón niektorý organizmus nevyužíva (alebo takmer nepoužíva) z dôvodu nerovnomerného výskytu niektorých nukleotidov (GC zloženie), prípadne kombinácií nukleotidov. Výsledkom je, že takýto kodón môže úplne vymiznúť z používania (napríklad v dôsledku straty zodpovedajúcej tRNA) a môže byť neskôr použitý na kódovanie inej aminokyseliny bez toho, aby došlo k významnému poškodeniu tela. Tento mechanizmus môže byť zodpovedný za vznik niektorých kódových dialektov v mitochondriách.

Druhým je transformácia stop kodónu na zmysel pre vajíčka. V tomto prípade môžu mať niektoré z preložených proteínov prídavky. Situáciu však čiastočne zachraňuje fakt, že mnohé gény často končia nie jedným, ale dvoma stop kodónmi, keďže sú možné chyby prekladu, pri ktorých sa stop kodóny čítajú ako aminokyseliny.

Tretím je možné nejednoznačné čítanie určitých kodónov, ako je to v prípade niektorých húb.

8 . Konektivita. Nazývajú sa skupiny ekvivalentných kodónov (t. j. kodónov, ktoré kódujú rovnakú aminokyselinu). v sérii. GC obsahuje 21 sérií vrátane stop kodónov. V nasledujúcom texte bude pre istotu označovaná akákoľvek skupina kodónov spojka, ak z každého kodónu tejto skupiny môžete prejsť na všetky ostatné kodóny tej istej skupiny postupnými nukleotidovými substitúciami. Z 21 sérií je 18 spojených 2 série, každá obsahuje jeden kodón a len 1 séria pre aminokyselinu serín nie je spojená a rozpadá sa na dve spojené podsérie.


Ryža. 5. Grafy konektivity pre niektoré série kódov. a - spojená séria valínu; b - spojené série leucínu; Séria serínov je nekoherentná a delí sa na dve spojené podsérie. Obrázok je prevzatý z článku V.A. Ratner" Genetický kód ako systém."

Vlastnosť konektivity možno vysvetliť skutočnosťou, že počas obdobia formovania GC zachytil nové kodóny, ktoré sa minimálne líšili od tých, ktoré už boli použité.

9. Pravidelnosť vlastnosti aminokyselín na základe koreňov tripletov. Všetky aminokyseliny kódované tripletmi koreňa U sú nepolárne, nemajú žiadne extrémne vlastnosti a veľkosti a majú alifatické radikály. Všetky triplety s koreňom C majú silné zásady a aminokyseliny, ktoré kódujú, majú relatívne malú veľkosť. Všetky triplety s koreňom A majú slabé bázy a kódujú polárne aminokyseliny nie malej veľkosti. Kodóny s koreňom G sa vyznačujú extrémnymi a anomálnymi variantmi aminokyselín a sérií. Kódujú najmenšiu aminokyselinu (glycín), najdlhšiu a plochú (tryptofán), najdlhšiu a najdrsnejšiu (arginín), najreaktívnejšiu (cysteín) a tvoria anomálnu podsériu serínu.

10. Blokovosť. Všeobecný občiansky zákonník je „blokový“ kódex. To znamená, že aminokyseliny s podobnými fyzikálno-chemickými vlastnosťami sú kódované kodónmi, ktoré sa navzájom líšia jednou bázou. Blokový charakter kódu je jasne viditeľný na nasledujúcom obrázku.


Ryža. 6. Bloková štruktúra Občianskeho zákonníka. Aminokyseliny s alkylovou skupinou sú označené bielou farbou.


Ryža. 7. Farebné znázornenie fyzikálno-chemických vlastností aminokyselín na základe hodnôt opísaných v kniheStyers "Biochémia". Na ľavej strane je hydrofóbnosť. Vpravo je schopnosť vytvárať v proteíne alfa helix. Červená, žltá a modrá farba označujú aminokyseliny s vysokou, strednou a nízkou hydrofóbnosťou (vľavo) alebo zodpovedajúcim stupňom schopnosti vytvárať alfa helix (vpravo).

Vlastnosť blokovosti a pravidelnosti možno vysvetliť aj tým, že v období formovania GC zachytil nové kodóny, ktoré sa minimálne líšili od už používaných.

Kodóny s rovnakými prvými bázami (prefixy kodónov) kódujú aminokyseliny s podobnými biosyntetickými dráhami. Kodóny aminokyselín patriacich do šikimátových, pyruvátových, aspartátových a glutamátových rodín majú U, G, A a C ako predpony. O cestách starovekej biosyntézy aminokyselín a jej spojení s vlastnosťami moderného kódu pozri „Staroveký dublet genetický kód bola predurčená cestami syntézy aminokyselín." Na základe týchto údajov niektorí výskumníci dospeli k záveru, že na tvorbu kódu mali veľký vplyv biosyntetické vzťahy medzi aminokyselinami. Podobnosť biosyntetických dráh však vôbec neznamená podobnosť fyzikálno-chemických vlastností.

11. Imunita proti hluku. V najvšeobecnejšej forme šumová imunita HA znamená, že pri náhodných bodových mutáciách a chybách translácie sa fyzikálno-chemické vlastnosti aminokyselín veľmi nemenia.

Náhrada jedného nukleotidu v triplete vo väčšine prípadov buď nevedie k zmene v kódovanej aminokyseline, alebo vedie k zmene na aminokyselinu s rovnakou polaritou.

Jedným z mechanizmov, ktorý zaisťuje odolnosť GC proti hluku, je jeho degenerácia. Priemerná degenerácia sa rovná počtu kódovaných signálov/celkovému počtu kodónov, kde kódované signály zahŕňajú 20 aminokyselín a znak ukončenia translácie. Priemerná degenerácia pre všetky aminokyseliny a znak ukončenia sú tri kodóny na kódovaný signál.

Na kvantifikáciu odolnosti voči šumu uvádzame dva pojmy. Nukleotidové substitučné mutácie, ktoré nevedú k zmene triedy kódovanej aminokyseliny, sa nazývajú konzervatívny. Mutácie nukleotidových substitúcií vedúce k zmene triedy kódovanej aminokyseliny sa nazývajú radikálny .

Každý triplet umožňuje 9 jednotlivých substitúcií. Celkovo existuje 61 tripletov kódujúcich aminokyseliny. Preto je počet možných nukleotidových substitúcií pre všetky kodóny

61 x 9 = 549. Z toho:

Výsledkom 23 nukleotidových substitúcií sú stop kodóny.

134 substitúcií nemení kódovanú aminokyselinu.
230 substitúcií nemení triedu kódovanej aminokyseliny.
162 substitúcií vedie k zmene triedy aminokyselín, t.j. sú radikálne.
Zo 183 substitúcií 3. nukleotidu vedie 7 k objaveniu sa terminátorov translácie a 176 je konzervatívnych.
Zo 183 substitúcií 1. nukleotidu vedie 9 k objaveniu sa terminátorov, 114 je konzervatívnych a 60 je radikálnych.
Zo 183 substitúcií 2. nukleotidu vedie 7 k výskytu terminátorov, 74 je konzervatívnych, 102 je radikálnych.

Na základe týchto výpočtov získame kvantitatívne hodnotenie odolnosti kódu voči šumu ako pomer počtu konzervatívnych náhrad k počtu radikálnych náhrad. Rovná sa 364/162 = 2,25

Pri realistickom posúdení podielu degenerácie na hlukovej imunite je potrebné brať do úvahy frekvenciu výskytu aminokyselín v bielkovinách, ktorá sa u rôznych druhov líši.

Aký je dôvod odolnosti kódu proti šumu? Väčšina výskumníkov verí, že táto vlastnosť je dôsledkom výberu alternatívnych GC.

Stephen Freeland a Lawrence Hurst vygenerovali náhodné takéto kódy a zistili, že iba jeden zo sto alternatívnych kódov nebol o nič menej odolný voči hluku ako univerzálny kód.
Ešte zaujímavejšia skutočnosť sa objavila, keď títo výskumníci zaviedli ďalšie obmedzenie na zohľadnenie skutočných trendov vo vzorcoch mutácií DNA a chybách prekladu. Za takýchto podmienok sa LEN JEDEN KÓD Z MILIONU MOŽNÝCH ukázal byť lepším ako kanonický kód.
Túto bezprecedentnú vitalitu genetického kódu možno najľahšie vysvetliť tým, že vznikol ako výsledok prirodzeného výberu. Možno bolo kedysi v biologickom svete veľa kódov, z ktorých každý mal svoju vlastnú citlivosť na chyby. Organizmus, ktorý sa s nimi lepšie vyrovnal, mal väčšiu šancu na prežitie a kanonický kódex jednoducho vyhral boj o existenciu. Tento predpoklad sa zdá byť celkom realistický – napokon vieme, že alternatívne kódy skutočne existujú. Viac informácií o odolnosti voči šumu nájdete v Kódovanej evolúcii (S. Freeland, L. Hirst „Coded evolution“. // Vo svete vedy. - 2004, č. 7).

Na záver navrhujem spočítať počet možných genetických kódov, ktoré možno vygenerovať pre 20 kanonických aminokyselín. Z nejakého dôvodu som sa s týmto číslom nikde nestretol. Potrebujeme teda, aby vygenerované GC obsahovali 20 aminokyselín a stop signál, kódovaný MINIMÁLNE JEDEN KODÓN.

Poďme mentálne očíslovať kodóny v určitom poradí. Budeme zdôvodňovať nasledovne. Ak máme presne 21 kodónov, potom každá aminokyselina a stop signál obsadí presne jeden kodón. V tomto prípade bude možných 21 GC!

Ak existuje 22 kodónov, objaví sa ďalší kodón, ktorý môže mať jeden z 21 zmyslov a tento kodón sa môže nachádzať na ktoromkoľvek z 22 miest, zatiaľ čo zvyšné kodóny majú presne jeden odlišný zmysel, ako v prípade 21. kodóny. Potom dostaneme počet kombinácií 21!x(21x22).

Ak existuje 23 kodónov, potom, uvažujúc podobne, dostaneme, že 21 kodónov má každý presne jeden odlišný význam (21! možností) a dva kodóny majú každý 21 rôznych významov (21 2 významy s PEVNOU pozíciou týchto kodónov). Počet rôznych pozícií pre tieto dva kodóny bude 23x22. Celkový počet variantov GC pre 23 kodónov je 21!x21 2x23x22

Ak je kodónov 24, potom počet GC bude 21!x21 3 x24x23x22,...

....................................................................................................................

Ak existuje 64 kodónov, potom počet možných GC bude 21!x21 43 x64!/21! = 21 43 x 64! ~ 9,1 x 10 145