Раздел 8 ТРАНСЛАЦИЯ (ПРЕВЕЖДАНЕ) – ГЕНЕТИЧЕН КОД И УЧАСТНИЦИ В ПРОЦЕСА
При много малка част от гените зрялата РНК е крайният продукт на експресията. Повечето гени са за белтъци. Белезите на организма в крайна сметка се определят от белтъците, които той може да произвежда. Белтъчната синтеза подобно на РНК-синтезата е матрична. В този случай обаче продуктът (полипептидната верига) силно се различава от матрицата (мРНК). Затова белтъчната синтеза се нарича транслация или превеждане (на мРНК).
Поради комплементарното взаимодействие на нуклеотидите транскрипцията е сравнително прост процес. С транслацията не е така. Аминокиселините нямат пространствено сродство към нуклеотидите. Само малък брой белтъци (ензими и регулатори) могат да се свързват специфично с РНК или ДНК. Това свойство обаче се появява едва когато е готова не само първичната, а и третичната структура на белтъка. Транслацията не би могла да се основава на пряко взаимодействие между матрицата и продукта. Затова тя изисква сложна ”материална база”.
1. Генетичен код
Преди да се разгледа механизмът на транслацията, уместно е да се обсъди крайният й резултат. Информацията за даден белтък по същество се запазва по пътя от ДНК до белтъка, само се преобразува от нуклеотиден в аминокиселинен запис. Всеки начин да се прехвърля информация от една в друга система от знаци се нарича код. Закономерностите, които съпоставят аминокиселини на нуклеотидите от мРНК, представляват т. нар. генетичен код. Терминът транслация е създаден по аналогия с превеждането от един език на друг; ако продължим сравнението, то генетичният код е нуклеиново-белтъчният речник.
Най-простият тип код е синглетният, който на един знак съпоставя също един знак. Генетичният код обаче не би могъл да бъде синглетен. В мРНК има 4 вида нуклеотиди. При синглетен код те биха съответствали на 4 аминокиселини, а в белтъчната синтеза участват 20 различни аминокиселини. Следващата възможност е дублетен код: на 2 нуклеотида да се съпоставя 1 аминокиселина. Съчетанията от 2 нуклеотида са 4 на квадрат = 16 – не достигат за малко. При триплетен код 3 нуклеотида биха кодирали 1 аминокиселина. Възможните съчетания от 3 нуклеотида, наречени триплети, са 4 на куб = 64. Това е повече от достатъчно за кодиране на 20 аминокиселини. Принципно нищо не пречи една аминокиселина да се кодира от 4 или 5 нуклеотида, но това изглежда излишно усложняване и разточителство. Така още преди да е направен първият опит за установяване на генетичния код, е станало ясно, че кодът трябва да е триплетен. Триплетите в мРНК са били наречени кодони. На този етап са възникнали други въпроси: дали от възможните 64 кодона се използват само 20 или кодът е изроден, т.е. някои аминокиселини се кодират от 2 или повече триплета; дали има нуклеотиди, които участват едновременно в 2 съседни кодона (кодът се припокрива); дали, обратно, има разделителни знаци (нуклеотиди, които разделят съседни кодони, без да участват в нито един от тях); има ли специални кодони или други съчетания за начало и край; и, разбира се, кой кодон на коя аминокиселина отговаря и дали в това отношение има разлики при различните организми.
Натрупването на познания за РНК, белтъците и белтъкосинтезиращия апарат е позволило да се отговори на тези въпроси. Първо изкуствено (без участието на ДНК-матрица) са били синтезирани къси вериги РНК с известна последователност. Те са били прибавяни вместо мРНК в система за транслация in vitro. Полученият полипептид е бил подлаган на секвениране (определяне на първичната структура) и сравняван с изкуствената РНК.
Резултатът от тези проучвания е таблицата, която показва кой кодон на коя аминокиселина съответства.
Вижда се, че кодът е изроден. От 64-те кодона 61 кодират аминокиселини. Останалите три, а именно УАА, УАГ и УГА, служат като сигнали за край на транслацията. Наричат се завършващи, терминални, безсмислени или стоп-кодони. За повечето аминокиселини има 2 или 4 кодона. Те се различават по третия си нуклеотид. Някои аминокиселини разполагат с по цели 6 кодона. Две аминокиселини, метионин и триптофан, се кодират само от по 1 кодон. Метиониновият кодон АУГ, когато е разположен подходящо в предния край на мРНК, служи и като сигнал за започване на синтезата. Генетичният код притежава ”целесъобразност”: за тези аминокиселини, които по-често се срещат в белтъците, има повече кодони. А може да е било и обратното: примитивната клетка, след като се е снабдила с този генетичен код, да е възприела и нагоден към него белтъчен състав. Появата на транслацията е безспорно най-неясният момент от произхода на живота.
По-рано се е смятало, че описаният код е абсолютно универсален, т.е. има посочения вид за всички геноми. Впоследствие се е наложило в това твърдение да се добави думата “почти”. Има някои геноми-изключения, в които отделни кодони имат друго значение. Например при най-малките и прости микроорганизми – микоплазмите, УГА не е завършващ кодон, а кодира триптофан. Понеже даденият в горната таблица код е почти, но не изцяло универсален, днес той се означава като стандартен.
Доколкото можем да съдим, редките отклонения от стандартния код са вторични, т.е. по някаква причина са се появили в еволюцията на генетична система, която първоначално е спазвала стандартния код. Тези отклонения никога не са големи. Дори и най-простият организъм се нуждае от много белтъци и е трудно да се правят "рационализации" на генетичния код в движение, без при това да се увреди първичната структура на някой жизнено важен белтък. Универсалността на стандартния код е принудителна.
Други свойства, които не личат от таблицата, са, че кодът е неприпокриващ се и без разделителни знаци (запетаи). Поради липсата на разделителни знаци точката, откъдето започва разчитането, има голямо значение. Всяко групиране на нуклеотидите в кодони се нарича рамка на четене. Тъй като кодът е триплетен, за всяка мРНК са възможни 3 рамки на четене. За ДНК те са 6, защото трябва да се вземат предвид и двете вериги.
Рамките на четене могат да се илюстрират с помощта на следния текст:
РАКОСАМИГОЛЯВАСОКАЛОСИТУКМИТШУМ
Ако той се раздели на ”триплети” от букви, като се започне от началото, получава се следното:
рак оса миг Оля вас ока лос иту кми тшу
Ако се започне след първата буква, получават се други триплети:
ако сам иго ляв асо кал оси тук мит шум
Третата възможна рамка на четене е тази:
кос ами гол Ява сок ало сит укм итш
Вижда се, че смисълът в трите случая е съвсем различен. Освен това примерът е нагласен така, че само при втората рамка триплетите да имат значение докрай. Първата и третата рамка бързо стигат до безсмислени буквени съчетания.
Ако 4-те нуклеотида имат равни дялове в ДНК, а подреждането им е случайно, то кодон АУГ ще се среща средно веднъж на 64 кодона, а завършващ кодон – веднъж на 21 кодона. Тръгне ли се от някое случайно получено АУГ, бързо ще се стигне до също случайно получен краен кодон. Рамка на четене, в която терминалните кодони са начесто, се нарича затворена или блокирана.
Крайни кодони няма да има само ако естественият отбор не ги допуска. Това се наблюдава в гените за белтъци. Там една от рамките на четене, наречена отворена, започва от АУГ и обхваща стотици или хиляди нуклеотиди, преди да стигне до стоп-кодон. (Другите 5 рамки и тук са затворени и не се използват.) Понякога под рамки на четене се подразбират само отворените рамки.
Познаването на генетичния код се използва за изучаване на белтъците чрез техните гени. Установяването на първичната структура (секвениране) е по-лесно за ДНК, отколкото за белтъците. От последователността на гена може да се изведе последователността на белтъка (обратното не е възможно, тъй като кодът е изроден). И така, ако искаме да проучим даден белтък, изолираме неговия ген. Секвенираме го. В получената последователност намираме използваната рамка на четене. За целта шестте възможни рамки се претърсват за отворени участъци, по-дълги от, да речем, 100 нуклеотида. След това на всеки кодон се съпоставя съответната аминокиселина. Получава се последователността на белтъка.
На основата на генетичния код можем да оценим точковите генни мутации. Те биват: заместване (субституция), загуба (делеция) и вмъкване (инсерция).
Заместването на един нуклеотид с друг може изобщо да не се отрази на белтъка поради изродеността на кода – ”мълчалива” мутация. По-често резултатът ще бъде получаване на кодон за друга аминокиселина – мутация с промяна на смисъла (missense). Сърповидноклетъчната анемия и още редица наследствени болести се дължат на субституция на един-единствен нуклеотид. Други мутации с промяна на смисъла обаче са безвредни и попълват нормалното генетично разнообразие на популацията, а малък брой се оказват полезни. Трети възможен резултат от заместването е ”обикновен” кодон да се превърне в завършващ. Това е мутация със загуба на смисъла – безсмислена (nonsense) мутация. Ако засегнатият кодон не е съвсем близо до естествения стоп-кодон, последиците са драматични: получава се скъсен полипептид, негоден за нищо.
Делециите и инсерциите, дори когато засягат само 1 нуклеотид, объркват всички следващи кодони. Те се наричат мутации с изместване на рамката (frameshift). Резултатът е като при безсмислените мутации. Изключение са делециите и инсерциите на 3 нуклеотида. Тогава ”само” се губи или добавя една аминокиселина, а останалите се запазват. Има шанс белтъкът да запази функцията си.
Сега е ясно защо снаждането на еукариотните пре-мРНК трябва да става с изрядна точност.
След като беше обсъдена равносметката от транслацията, може да се разгледа нейният апарат – ”черната кутия”, в която влизат мРНК, аминокиселини и енергия, за да излезе белтък.
2. Участници в транслацията
2.1. тРНК
Както се спомена, между нуклеотидите и аминокиселините няма пространствено сродство. Нужен е адаптор, който да има сродство и към кодоните, и към аминокиселините. Този адаптор е тРНК. Към 3’-края й се закача аминокиселината. В съвсем друга част на молекулата има 3 съседни нуклеотида, комплементарни на кодона. Този триплет в тРНК се нарича антикодон.
тРНК са малки (около 80 нуклеотида). За разлика от другите РНК функционират сами, а не се свързват с белтъци в нуклеопротеинови комплекси. Както знаем, измежду всички РНК тРНК са най-богати на модифицирани нуклеотиди. Някои от тях са нужни, за да заеме молекулата необходимата за функциите й структура, а други най-вероятно просто осигуряват защита от рибонуклеази.
На http://www.ncbi.nlm.nih.gov:80/books/bv.fcgi?call=bv.View..ShowSection&rid=cell.figgrp.340
е дадена обобщената вторична структура на тРНК. Поради формата си тя се нарича детелинов лист. Двуверижните участъци заемат голям дял в молекулата. Т. нар. допълнителна бримка силно варира не само по състав, а и по дължина. Останалата част от молекулата е по-консервативна. Оформя 4 рамена: акцепторно, псевдоуридиново, антикодоново и дихидроуридиново. Акцепторното рамо включва двата свободни края, а в другите три рамена веригата се огъва, образувайки бримки.
Дихидроуридиновата бримка се нарича така, понеже съдържа модифицираната база дихидроуридин (D). Псевдоуридиновата бримка включва консервативен триплет: риботимидин (Т) – псевдоуридин (пси) – цитидин (С).
Акцепторното рамо носи това име, тъй като към него се прикрепя аминокиселината. 3’-краят стърчи навън с 4 нуклеотида. Крайните 3 от тях винаги са ЦЦА и последният аденозин се свързва с аминокиселината.
Антикодоновата бримка съдържа антикодона точно там, където РНК-веригата завива на 180 градуса. Бримката е огъната така, че взаимодействието антикодон – кодон да бъде по-свободно от обичайните комплементарни свързвания. Вторият и третият антикодонов нуклеотид се свързват строго комплементарно с втория и първия кодонов нуклеотид съответно. Между 1. нуклеотид от антикодона и 3. нуклеотид от кодона обаче има нееднозначно съответствие поради гъвкавостта на антикодоновата бримка – ”люлеене”. Таблицата на генетичния код показва, че кодоните за една и съща аминокиселина се различават именно по третия си нуклеотид. Люлеенето позволява някои изродени кодони да се разпознават от един антикодон. Така У от антикодона може да се свърже с А или Г, а Г – с Ц или У. Някои антикодони на 1. място съдържат модифицирания нуклеозид инозин, способен да свърже У, Ц или А. Благодарение на люлеенето транслацията може да протича със сравнително малко тРНК – повече от 20, но много по-малко от 61. На теория за 61 кодона при наличие на люлеене са нужни 31 тРНК.
Детелиновият лист се нагъва в пространството и образува третична Г-образна структура (вж. отново http://www.ncbi.nlm.nih.gov:80/books/bv.fcgi?call=bv.View..ShowSection&rid=cell.figgrp.340. Тя се поддържа от допълнителни водородни връзки. Акцепторното и псевдоуридиновото рамо, усуквайки се заедно, образуват късата пръчица на Г-то, а антикодоновото и дихидроуридиновото рамо – дългата. Крайното ЦЦА и антикодонът са максимално открити – разполагат се на двата края на буквата Г.
2.2. Активиращи ензими
Синтезата на полипептид от аминокиселини е поликондензация с отделяне на вода. Както стана дума при транскрипцията, такива реакции са термодинамично неизгодни във воден разтвор. За да протекат, трябва субстратът да се активира предварително, така че неизгодната реакция да се спрегне с някоя много изгодна. Аминокиселините се активират рано, още преди да се реши за кой белтък ще се използват. Реакцията се катализира от ензимите аминоацил-тРНК-синтетази, често наричани за по-кратко активиращи или натоварващи ензими.
Активиращите ензими плуват в цитозола без пряка връзка с рибозомите или мРНК. Бактериите имат по една синтетаза за всяка аминокиселина. Общо взето, така е и при еукариотите, макар че в отделни случаи за една аминокиселина има повече от един ензим.
Енергията за активиране идва от АТФ. Върху активния център на ензима се настаняват аминокиселината и АТФ. Отделя се пирофосфат и аминокиселината се аденилира, т.е. свързва се с АМФ с макроергична връзка. С това тя вече е активирана.
Полученият аминоациладенилат обаче има кратък живот. Той е достатъчно активиран от химична гледна точка, но е негоден като субстрат за матрична синтеза. Затова остава върху ензима, докато към активния център се присъедини тРНК. Тя измества аденилатния остатък и той се отделя навън като АМФ. Аминоацилният остатък се прехвърля върху едната свободна ОН-група от 3’-крайния аденозин на тРНК. Тази естерна връзка, макар и да не се нарича макроергична, е достатъчно богата на енергия. Полученото съединение, аминоациладенилат, напуска ензима и дифундира, докато достигне някоя рибозома.
Активиране на аминокиселината и образуване на аминоацил-тРНК. Различните молекули не са дадени в един мащаб.
Трябва да се подчертае, че активиращият ензим не само повдига енергетичното ниво на аминокиселината, а и урежда срещата й с тРНК. Сама тРНК никога не би разпознала своята аминокиселина – 3’-краят на тРНК не е нагоден за такава сложна работа и е винаги еднакъв (ЦЦА). Без да имат пространствено сродство една към друга, тРНК и аминокиселината се събират благодарение на ензима, който има пространствено сродство и към двете. При това се разпознава не някакъв определен малък участък от тРНК, а цялостната й структура. Макар че функцията на тРНК е адапторна, без ензима тРНК би имала същия неуспех в разпознаването на аминокиселината, както и самата мРНК. Следователно аминоацил-тРНК-синтетазата е втори адаптор на транслацията с не по-малко важна роля от първия адаптор тРНК. Схема на двата адаптора е дадена на http://www.ncbi.nlm.nih.gov:80/books/bv.fcgi?tool=bookshelf&call=bv.View..ShowSection&searchterm=adaptor&rid=cell.figgrp.990.
2.3. Рибозома
Поради сложността си матричната синтеза на белтъци не може да се осигури от два-три свободно плуващи ензима, а протича в огромни рибонуклеопротеинови комплекси – рибозоми.
Рибозомата се състои от 2 субединици (субчастици) – голяма и малка. Всяка субединица е комплекс от рРНК и няколко десетки белтъци, които с незначителни изключения не се повтарят. Съставът на субединиците и общата им форма могат да се видят на http://www.ncbi.nlm.nih.gov:80/books/bv.fcgi?tool=bookshelf&call=bv.View..ShowSection&searchterm=ribosome&rid=cell.figgrp.999. Двете субединици се свързват в цялостна рибозома с помощта на магнезиеви йони. При еукариотите рибозомните субединици се изграждат в ядърцето, но стават функционално годни едва след като излязат в цитоплазмата. Така се гарантира, че в ядрото няма да протича белтъчна синтеза, която би притеснила ДНК и незрялата РНК.
В рибозомата има 3 участъка за свързване на РНК – един за мРНК и два за тРНК (вж. схемата). Този за мРНК лежи изцяло в малката субединица, докато двата участъка за тРНК са в перпердикулярно направление и обхващат и двете субединици. Единият приютява тази тРНК, за която е закрепен растящият полипептид – пептидил-тРНК. Затова се нарича пептидилен и се означава с П. В другия участък се настанява тРНК, която носи следващата аминокиселина – аминоацил-тРНК. Съответно участъкът се нарича аминоацилен и се означава с А. Ясно е, че двата участъка са сближени и успоредни, тъй като двата съседни кодона са един до друг, а на другия край двете аминокиселини също трябва да се сближат, за да се свържат.
Новата пептидна връзка се получава, като пептидът се откъсне от своята тРНК и се прехвърли върху самотната аминокиселина в съседство. Реакцията е термодинамично изгодна, но се нуждае от катализатор. Необходимата каталитична активност се нарича пептидил-трансферазна. Можем да кажем, че както за транскрипцията е нужна РНК-полимераза, така транслацията се катализира от ензима пептидил-трансфераза. След дълги изследвания обаче се е оказало, че въпросният ”ензим” всъщност е рибозим – определен домен на най-високомолекулната рРНК.
2.4. Транслационни фактори
За протичането на транслацията (също както при транскрипцията) са необходими спомагателни белтъци, наречени транслационни фактори. Според това на кой етап участват те биват инициаторни, елонгационни и освобождаващи фактори. Няма да ги обсъждаме подробно, а само ще посочим ролята им, когато разглеждаме отделните етапи на транслацията.
Основни източници
Марков Г. Тайните на клетката. 3. осн. прер. изд. Народна просвета, София, 1984.
Alberts B., D. Bray, J. Lewis, M. Raff, K. Roberts, J.D. Watson. Molecular Biology of the Cell. 3rd Edition. Garland Publishing Inc., New York, London, 1994. [Online] http://www.ncbi.nlm.nih.gov/books/bv.fcgi?call=bv.View..ShowSection&rid=cell
Elzanowski A., J. Ostell (2000). The genetic codes. [Online] http://www.ncbi.nlm.nih.gov/htbin-post/Taxonomy/wprintgc?mode=c#SG1
Gilbert S.F. Developmental Biology. 6th Edition. Sinauer Associates, Inc., Sunderland, USA, 2000. [Online] http://www.devbio.com/
King M.W. (2001). Protein synthesis. [Online] http://www.indstate.edu/thcme/mwking/protein-synthesis.html
Lewin B. Genes. John Wiley & Sons Inc., New York, 1983.
Mathews C.K., K.E. van Holde, K.G. Ahern. Biochemistry. 3rd Edition. Addison-Wesley Longman, San Francisco, 2000. [Online] http://www.orst.edu/instruction/bb492/lectures/TranslationII.html
Stryer L. Biochemistry. 4th Edition. W.H. Freeman & Co., New York, 1995.За това, че пептидил-трансферазата е рРНК: Schimmel P., R. Alexander (1998). All you need is RNA. Science 281: 658-659.URL http://www.mayamarkov.com/biology/08Translat1/08Translat1.htm
Публикувано 2003
Copyright © Майя Маркова