Генетический код: описание, характеристики, история исследования. Код в коде: раскрыт второй генетический код

  • Дата: 16.10.2019

Ведущий научный журнал Nature сообщил об обнаружении второго генетического кода – такого себе «кода внутри кода», который был недавно взломан молекулярными биологами и компьютерными программистами. Более того, для того чтобы его выявить, они использовали не эволюционную теорию, а информационные технологии.

Новый код получил название Код Сплайсинга. Он находится внутри ДНК. Этот код контролирует основной генетический код очень сложным, однако, предсказуемым образом. Код сплайсинга управляет тем, как и когда происходит сборка генов и регулирующих элементов. Раскрытие этого кода внутри кода помогает пролить свет на некоторые давнишние тайны генетики, которые всплыли на поверхность после проведения Проекта по расшифровке полной последовательности генома человека. Одна из таких тайн заключалась в том, почему в таком сложном организме, как человеческий, существует всего лишь 20 000 генов? (Ученые ожидали обнаружить намного больше.) Почему гены разбиваются на сегменты (экзоны), которые разделяются некодирующими элементами (интроны), а затем после транскрипции соединяются вместе (т.е. сплайсируются)? И почему гены включаются в одних клетках и тканях, и не включаются в других? На протяжении двух десятилетий молекулярные биологи пытались выяснить механизмы генетической регуляции. Эта статья указывает на очень важный момент в понимании того, что происходит на самом деле. Она не дает ответы на все вопросы, но она демонстрирует, что внутренний код существует. Этот код – система передачи информации, которую можно так понятно расшифровать, что ученые могли бы прогнозировать, как в определенных ситуациях и с необъяснимой точностью может вести себя геном.

Представьте, что в соседней комнате вы слышите оркестр. Вы открываете дверь, заглядываете внутрь и видите в комнате трех или четырех музыкантов, играющих на музыкальных инструментах. Это то, на что, по словам Брендона Фрея, участвовавшего в раскрытии кода, похож человеческий геном. Он говорит: «Мы смогли обнаружить только 20,000 генов, но мы знали, что они образуют огромное количество белковых продуктов и регулирующих элементов. Как? Один из методов называется альтернативным сплайсингом» . Различные экзоны (части генов) могут собираться разными способами. «Например, три гена белка нейрексина могут создавать более 3000 генетических посланий, которые помогают управлять системой связей мозга» , - говорит Фрей. Тут же в статье говорится о том, что ученым известно, что 95% наших генов имеют альтернативный сплайсинг, и в большинстве случаев в разных типах клеток и тканей транскрипты (молекулы РНК, образующиеся в результате транскрипции) экспрессируются по-разному. Должно быть что-то, что управляет тем, как собираются и экспрессируются эти тысячи комбинаций. В этом и состоит задача Кода Сплайсинга.

Читатели, которые хотят получить беглый обзор открытия, могут прочитать статью в Science Daily под названием «Исследователи, взломавшие ‘Код сплайсинга’, раскрывают тайну, лежащую в основе биологической сложности» . В статье говорится: «Ученые из университета Торонто получили фундаментально новое представление о том, как живые клетки используют ограниченное число генов для образования таких невероятно сложных органов, как мозг» . Сам журнал Nature начинается со статьи Хейди Ледфорда «Код внутри кода». Затем последовала статья Техедора и Валькарсела под названием «Регуляция генов: взлом второго генетического кода. И, наконец, решающей стала статья группы исследователей из университета Торонто под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея, «Расшифровывая код сплайсинга».

Эта статья – победа информационной науки, которая напоминает нам дешифровальщиков времен Второй Мировой Войны. Их методы включали алгебру, геометрию, теорию вероятностей, векторное исчисление, теорию информации, оптимизацию кода программы, и другие передовые методы. В чем они не нуждались, так это в эволюционной теории , которая никогда не упоминалась в научных статьях. Читая эту статью, можно увидеть, под каким сильным напряжением находятся авторы этой увертюры:

«Мы описываем схему ‘кода сплайсинга’, в которой используются комбинации сотен свойств РНК для того, чтобы предсказать обусловленные тканями изменения в альтернативном сплайсинге тысячи экзонов. Код устанавливает новые классы схем сплайсинга, распознает разные регулирующие программы в разных тканях и устанавливает контролируемые мутациями регулирующие последовательности. Мы раскрыли широко распространенные регулирующие стратегии, включая: использование непредвиденно крупных объединений свойств; выявление низких уровней включения экзона, которые ослабляются свойствами специфических тканей; проявление свойств в интронах глубже, чем считалось раньше; и модуляция уровней сплайс-варианта структурными характеристиками транскрипта. Код помог установить класс экзонов, включение которых заглушает экспрессию в тканях взрослого организма, активируя деградацию мРНКа, и исключение которых способствует экспрессии во время эмбриогенеза. Код облегчает раскрытие и детальное описание регулируемых событий альтернативного сплайсинга в масштабах всего генома».

В команде, взломавшей код, участвовали специалисты с кафедры электронной и вычислительной техники, а также с кафедры молекулярной генетики. (Сам же Фрей работает в подразделении корпорации Microsoft, Microsoft Research) Подобно дешифровальщикам прошлого времени, Фрей и Бараш разработали «новый метод биологического анализа, проводимого с помощью компьютера, который обнаруживает ‘кодовые слова’, запрятанные внутри генома» . С помощью огромного количества данных, созданных молекулярными генетиками, группа исследователей проводила «обратную разработку» кода сплайсинга до тех пор, пока они не смогли предсказать, как он будет действовать . Как только исследователи с этим справились, они проверили этот код на мутациях и увидели, как вставляются или удаляются экзоны. Они обнаружили, что код даже может вызывать тканеспецифические изменения или действовать по-разному в зависимости от того, взрослая это мышь или эмбрион. Один ген, Xpo4, связан с раком; исследователи отметили: «Эти данные подтверждают вывод о том, что экспрессия Xpo4 гена должна строго контролироваться во избежание возможных губительных последствий, включая онкогенез (рак), так как он активен во время эмбриогенеза, но его количество снижено в тканях взрослого организма. Оказывается, что они были абсолютно удивлены уровнем контроля, который они увидели. Намеренно или нет, но в качестве ключа к разгадке Фрей использовал не случайную изменчивость и отбор, а язык разумного замысла. Он отметил: «Понимание сложной биологической системы подобно пониманию сложной электронной схемы».

Хейди Ледфорд сказал, что кажущаяся простота генетического кода Уотсона-Крика, с его четырьмя основаниями, триплетными кодонами, 20 аминокислотами и 64 «символами» ДНК – скрывает под собой целый мир сложности . Заключенный внутри этого более простого кода, Код сплайсинга намного сложнее.

Но между ДНК и белками находится РНК – отдельный мир сложности. РНК – это трансформер, который иногда переносит генетические послания, а иногда управляет ими, задействуя при этом множество структур, способных влиять на его функцию. В статье, опубликованной в этом же выпуске, группа исследователей под руководством Бенджамина Д. Бленкоу и Брендона Д. Фрея из университета Торонто в Онтарио, Канада, сообщает о попытках разгадать второй генетический код, который может предсказывать, как сегменты информационной РНК, транскрибированные с определенного гена, могут смешиваться и сочетаться, чтобы образовывать разнообразные продукты в разных тканях. Это процесс известен как альтернативный сплайсинг. На этот раз нет никакой простой таблицы – вместо неё алгоритмы, которые объединяют более чем 200 различных свойств ДНК с определениями структуры РНК.

Работа этих исследователей указывает на быстрый прогресс, которого достигли вычислительные методы в составлении модели РНК. В дополнение к пониманию альтернативного сплайсинга, информатика помогает ученым предсказывать структуры РНК и устанавливать маленькие регулирующие фрагменты РНК, которые не кодируют протеины. «Это замечательное время» , - говорит Кристофер Берг, компьютерный биолог из массачусетского института технологий в Кембридже. «В будущем нас ждёт огромный успех» .

Информатика, компьютерная биология, алгоритмы и коды – эти концепции не были частью дарвиновского словаря, когда он разрабатывал свою теорию. У Менделя была очень упрощенная модель того, как распределяются признаки во время унаследования. К тому же, идея о том, что признаки кодируются, была представлена только в 1953 году. Мы видим, что исходный генетический код регулируется еще более сложным, включенным в него, кодом. Это революционные идеи . К тому же есть все признаки того, что этот уровень контроля не последний . Ледфорд напоминает нам, что например, РНК и белки имеют трехмерную структуру. Функции молекул могут изменяться, когда изменяется их форма Должно существовать что-то, что контролирует складывание, так что трехмерная структура выполняет то, что требует функция. К тому же, доступ к генам, по-видимому, контролируется другим кодом, гистоновым кодом . Этот код закодирован молекулярными маркерами или «хвостами» на гистоновых белках, которые служат центрами для скручивания и суперскручивания ДНК. Описывая наше время, Ледфорд говорит о «постоянном возрождении в информатике РНК» .

Техедор и Валькарсел согласны с тем, что за простотой кроется сложность. «По идее все выглядит очень просто: ДНК образует РНК, которая затем создает белок» , - начинают они свою статью. «Но в реальности всё намного сложнее» . В 1950-х годах мы узнали о том, что все живые организмы, от бактерий до человека, имеют основной генетический код. Но вскоре мы поняли, что сложные организмы (эукариоты) обладают каким-то неестественным и трудным для понимания свойством: их геномы имеют своеобразные участки, интроны, которые должны удаляться, чтобы экзоны могли соединиться вместе. Почему? Сегодня туман рассеивается: «Основное преимущество этого механизма заключается в том, что он позволяет разным клеткам выбирать альтернативные способы сплайсинга предшественника матричной РНК (пре-мРНК) и таким образом один ген образует различные послания», - объясняют они, - «а затем различные мРНК могут кодировать разные белки с различными функциями» . Из меньшего кода вы получаете больше информации, при условии, что внутри кода есть этот другой код, который знает, как это сделать.

Что и делает взлом кода сплайсинга настолько трудным, так это то, что факторы, контролирующие сборку экзонов, устанавливаются множеством других факторов: последовательностями, расположенными рядом с границами экзона, последовательностями интронов и регулирующими факторами, которые либо помогают, либо тормозят механизм сплайсинга. К тому же, «воздействия определенной последовательности или фактора могут изменяться в зависимости от её расположения относительно границ интрона-экзона или других регуляторных мотивов» , - поясняют Техедор и Валькарсел. «Поэтому самой сложной задачей в предсказании тканеспецифического сплайсинга является вычисление алгебры несметного числа мотивов и взаимоотношений между регуляторными факторами, которые их распознают» .

Для разрешения этой проблемы группа исследователей ввела в компьютер огромное количество данных о последовательностях РНК и условиях, в которых они образовались. «Затем компьютеру было дано задание - определить комбинацию свойств, которые лучше всего могли бы объяснить экспериментально установленный тканеспецифический отбор экзонов» . Другими словами, исследователи провели обратную разработку кода. Подобно дешифровальщикам времен Второй Мировой Войны, как только ученые узнают алгоритм, они могут делать предсказания: «Он правильно и с точностью установил альтернативные экзоны и предсказал их дифференциальное регулирование между парами типов тканей». И так же как любая хорошая научная теория, открытие дало новое понимание: «Это позволило нам по-новому объяснить ранее установленные регуляторные мотивы и указало на ранее неизвестные свойства известных регуляторов, а также неожиданные функциональные связи между ними» , - отметили исследователи. «Например, код подразумевает, что включение экзонов, ведущее к процессированным белкам, является общим механизмом управления процессом экспрессии генов во время перехода из эмбриональной ткани в ткань взрослого организма» .

Техедор и Валькарсел считают публикацию их статьи важным первым шагом: «Работу... лучше рассматривать как открытие первого фрагмента гораздо более крупного Розеттского камня, необходимого для расшифровки альтернативных сообщений нашего генома». По словам этих ученых, будущие исследования, несомненно, улучшат их знания об этом новом коде. В заключение своей статьи они вскользь упоминают эволюцию, и делают это очень необычным образом. Они говорят: «Это не значит, что эволюция создала эти коды. Это означает, что прогресс будет требовать понимания того, как коды взаимодействуют. Другой неожиданностью стало то, что наблюдаемая на сегодня степень сохранения поднимает вопрос о возможном существовании «видоспецифичных кодов» .

Код, вероятно, работает в каждой отдельной клетке и, поэтому, возможно должен отвечать более чем за 200 типов клеток млекопитающих животных. Также он должен справляться с огромным разнообразием схем альтернативного сплайсинга, не говоря уже о простых решениях о включении или пропуске отдельного экзона. Ограниченное эволюционное сохранение регулирования альтернативного сплайсинга (который по подсчетам составляет около 20% между людьми и мышами) поднимает вопрос о существовании видоспецифичных кодов. Более того, связь между процессингом ДНК и транскрипцией генов влияет на альтернативный сплайсинг, и последние данные указывают на упаковку ДНК гистоновыми белками и ковалентными модификациями гистонов (так называемый эпигенетический код) в регуляции сплайсинга. Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым кодом и кодом сплайсинга. То же самое касается еще мало понимаемого влияния сложных структур РНК на альтернативный сплайсинг.

Коды, коды и снова коды. То, что ученые практически ничего не говорят о дарвинизме в этих статьях, указывает на то, что эволюционным теоретикам – приверженцам старых идей и традиций, предстоит много над чем поразмышлять после того, как они прочтут эти статьи. А вот те, кто с восторженностью относится к биологии кодов, окажутся на передовой. У них есть замечательная возможность воспользоваться увлекательным веб-приложением, которое дешифровщики создали для того, чтобы стимулировать проведение дальнейшего исследования. Его можно найти на сайте университета Торонто под названием «Веб-сайт прогнозирования альтернативного сплайсинга». Посетители напрасно будут искать здесь упоминания об эволюции, и это несмотря на старую аксиому, что ничего в биологии не имеет без неё смысла. Новая версия этого выражения 2010 года может звучать так: «Ничто в биологии не имеет смысла, если не рассматривается в свете информатики» .

Ссылки и примечания

Мы рады, что смогли рассказать вам об этой истории в день её публикации. Возможно, это одна из наиболее значимых научных статей года. (Конечно же, значимым является каждое большое открытие, сделанное другими группами ученых, как открытие Уотсона и Крика.) Единственное, что мы можем сказать на это: «Вот это да!» Это открытие – замечательное подтверждение Сотворения по замыслу и огромный вызов дарвиновской империи. Интересно, как эволюционисты попытаются исправить свою упрощенную историю случайных мутаций и естественного отбора, которая была придумана еще в 19 столетии, в свете этих новых данных.

Вы поняли, о чем говорят Техедор и Валькарсел? Виды могут иметь свой собственный код, свойственный только этим видам. «Поэтому будущим методам предстоит установить точное взаимодействие между гистоновым [эпигенетическим] кодом и кодом сплайсинга», - отмечают они. В переводе это означает: «Дарвинисты здесь не причем. Они просто не способны с этим справиться». Если простой генетический код Уотсона-Крика был проблемой для дарвинистов, то, что они скажут теперь о коде сплайсинга, который из одних и тех же генов создает тысячи транскриптов? А как они справятся с эпигенетическим кодом, который управляет экспрессией генов? И кто знает, может в этом невероятном «взаимодействии», о котором мы только начинаем узнавать, задействованы и другие коды, напоминающие Розеттский камень, только начинающий показываться из песка?

Теперь, когда мы размышляем о кодах и информатике, мы начинаем думать о разных парадигмах нового исследования. Что если геном частично действует как сеть хранения данных? Что если в нем имеет место криптография или происходят алгоритмы сжатия? Нам следует вспомнить о современных информационных системах и технологиях хранения информации. Может быть, мы даже обнаружим элементы стеганографии. Несомненно, существуют дополнительные механизмы устойчивости, такие как дублирования и исправления, которые возможно помогут объяснить существование псевдогенов. Копирования всего генома могут быть реакциями на стресс. Некоторые из этих явлений могут оказаться полезными показателями исторических событий, которые не имеют ничего общего с универсальным общим предком, но помогают исследовать сравнительную геномику в рамках информатики и дизайна устойчивости, а также помогают понять причину заболевания.

Эволюционисты оказываются в сильном затруднении. Исследователи попытались видоизменить код, а получили только рак и мутации. Как они собираются пройти по полю приспособленности, если оно всё заминировано катастрофами, ждущими своего часа, как только кто-то начинает вмешиваться в эти неразрывно связанные коды? Мы знаем, что существует некая встроенная устойчивость и переносимость, но вся картина представляет собой невероятно сложную, разработанную, оптимизированную информационную систему , а не беспорядочное соединение частей, которыми можно бесконечно играться. Вся идея кода является концепцией разумного замысла.

A. E. Уайлдер-Смит придавал этому особое значение. Код предполагает соглашение между двумя частями. Соглашение – это заблаговременное согласие. Оно подразумевает планирование и цель. Символ SOS, как сказал бы Уайлдер-Смит, мы используем по соглашению как сигнал бедствия. SOS не выглядит как бедствие. Оно не пахнет как бедствие. Оно не ощущается как бедствие. Люди не понимали бы, что эти буквы обозначают бедствие, если бы они не понимали суть самого соглашения. Подобным образом, кодон аланина, ГЦЦ, не выглядит, не пахнет и не ощущается как аланин. Кодон не имел бы никакого отношения к аланину, если бы между двумя кодирующими системами (кодом белка и кодом ДНК) не было заранее установленного соглашения о том, что «ГЦЦ должен означать аланин». Для передачи этого соглашения используется семейство преобразователей, аминоацил-тРНК-синтетаз, которые переводят один код в другой.

Это должно было укрепить теорию замысла в 1950-х годах и многие креационисты эффективно её проповедовали. Но эволюционисты похожи на красноречивых торговцев. Они сочинили свои сказки о фее Динь-Динь, которая разбирает код и создает новые виды путем мутации и отбора, и убедили многих людей в том, что чудеса могут происходить и сегодня. Ну, хорошо, сегодня за окном 21-й век и нам известен эпигенетический код и код сплайсинга – два кода, которые намного сложнее и динамичнее, чем простой код ДНК. Мы знаем о кодах внутри кодов, о кодах над кодами и под кодами – нам известна целая иерархия кодов. На этот раз эволюционисты не могут просто вставить палец в пистолет и с блефом убеждать нас своими красивыми речами, когда по обеим сторонам расставлены пушки – целый арсенал, направленный на их главные элементы конструкции. Всё это игра. Вокруг них выросла целая эра информатики, они давно вышли из моды и похожи на Греков, которые пытаются с копьями лезть на современные танки и вертолеты.

Грустно признавать, но эволюционисты не понимают этого, или даже если и понимают, то не собираются сдаваться. Между прочим, на этой неделе, как раз когда была опубликована статья о Коде сплайсинга, со страниц продарвиновских журналов и газет посыпалась наиболее злая и ненавистная за последнее время риторика, направленная против креационизма и разумного замысда. Нам предстоит услышать еще о многих подобных примерах. И пока они держат в своих руках микрофоны и контролируют институты, многие люди будут попадаться на их удочку, думая, что наука продолжает давать им достаточное основание. Мы рассказываем вам всё это для того, чтобы вы читали этот материал, изучали его, понимали и запаслись информацией, которая вам необходима для того, чтобы сразить истиной этот фанатичный, вводящий в заблуждение вздор. А теперь, вперёд!

Нуклеотиды ДНК и РНК
  1. Пуриновые: аденин, гуанин
  2. Пиримидиновые: цитозин, тимин (урацил)

Кодон - триплет нуклеотидов, кодирующих определенную аминокислоту.

таб. 1. Аминокислоты, которые обычно встречаются в белках
Название Сокращенное обозначение
1. Аланин Ala
2. Аргинин Arg
3. Аспарагин Asn
4. Аспарагиновая кислота Asp
5. Цистеин Cys
6. Глутаминовая кислота Glu
7. Глутамин Gln
8. Глицин Gly
9. Гистидин His
10. Изолейцин Ile
11. Лейцин Leu
12. Лизин Lys
13. Метионин Met
14. Фенилаланин Phe
15. Пролин Pro
16. Серии Ser
17. Треонин Thr
18. Триптофан Trp
19. Тирозин Tyr
20. Валин Val

Генетический код, который еще называют аминокислотным кодом, - это система записи информации о последовательности расположения аминокислот в белке с помощью последовательности расположения нуклеотидных остатков в ДНК, которые содержат одно из 4-х азотистых оснований: аденин (А), гуанин (G), цитозин (C) и тимин (Т). Однако, поскольку двунитчатая спираль ДНК не принимает непосредственного участия в синтезе белка, который кодируется одной из этих нитей (т.е. РНК), то код записывается на языке РНК, в котором вместо тимина входит урацил (U). По этой же причине принято говорить, что код - это последовательность нуклеотидов, а не пар нуклеотидов.

Генетический код представлен определенными кодовыми словами, - кодонами.

Первое кодовое слово было расшифровано Ниренбергом и Маттеи в 1961 г. Они получили из кишечной палочки экстракт, содержащий рибосомы и прочие факторы, необходимые для синтеза белка. Получилась бесклеточная система для синтеза белка, которая могла бы осуществлять сборку белка из аминокислот, если в среду добавить необходимую мРНК. Добавив в среду синтетическую РНК, состоящую только из урацилов, они обнаружили, что образовался белок, состоящий только из фенилаланина (полифенилаланин). Так было установлено, что триплет нуклеотидов УУУ (кодон) соответствует фенилаланину. В течение последующих 5-6 лет были определены все кодоны генетического кода.

Генетический код - своеобразный словарь, переводящий текст, записанный с помощью четырех нуклеотидов, в белковый текст, записанный с помощью 20 аминокислот. Остальные аминокислоты, встречающиеся в белке, являются модификациями одной из 20 аминокислот.

Свойства генетического кода

Генетический код имеет следующие свойства.

  1. Триплетность - каждой аминокислоте соответствует тройка нуклеотидов. Легко подсчитать, что существуют 4 3 = 64 кодона. Из них 61 является смысловым и 3 - бессмысленными (терминирующими, stop-кодонами).
  2. Непрерывность (нет разделительных знаков между нуклеотидами) - отсутствие внутригенных знаков препинания;

    Внутри гена каждый нуклеотид входит в состав значащего кодона. В 1961г. Сеймур Бензер и Френсис Крик экспериментально доказали триплетность кода и его непрерывность (компактость) [показать]

    Суть эксперимента: "+" мутация - вставка одного нуклеотида. "-" мутация - выпадение одного нуклеотида.

    Одиночная мутация ("+" или "-") в начале гена или двойная мутация ("+" или "-") - портит весь ген.

    Тройная мутация ("+" или "-") в начале гена портит лишь часть гена.

    Четверная "+" или "-" мутация опять портит весь ген.

    Эксперимент был проведен на двух рядом расположенных фаговых генах и показал, что

    1. код триплетен и внутри гена нет знаков препинания
    2. между генами есть знаки препинания
  3. Наличие межгенных знаков препинания - наличие среди триплетов инициирующих кодонов (с них начинается биосинтез белка), кодонов - терминаторов (обозначают конец биосинтеза белка);

    Условно к знакам препинания относится и кодон AUG - первый после лидерной последовательности. Он выполняет функцию заглавной буквы. В этой позиции он кодирует формилметионин (у прокариот).

    В конце каждого гена, кодирующего полипептид, находится, по меньшей мере, один из 3-х терминирующих кодонов, или стоп-сигналов: UAA, UAG, UGA. Они терминируют трансляцию.

  4. Колинеарность - соответствие линейной последовательности кодонов мРНК и аминокислот в белке.
  5. Специфичность - каждой аминокислоте соответствуют только определенные кодоны, которые не могут использоваться для другой аминокислоты.
  6. Однонаправленность - кодоны считываются в одном направлении - от первого нуклеотида к последующим
  7. Вырожденность, или избыточность ,- одну аминокислоту может кодировать несколько триплетов (аминокислот – 20, возможных триплетов – 64, 61 из них смысловой, т. е. в среднем каждой аминокислоте соответствует около 3 кодонов); исключение составляет метионин (Met) и триптофан (Trp).

    Причина вырожденности кода состоит в том, что главную смысловую нагрузку несут два первых нуклеотида в триплете, а третий не так важен. Отсюда правило вырожденности кода : если два кодона имеют два одинаковых первых нуклеотида, а их третьи нуклеотиды принадлежат к одному классу (пуриновому или пиримидиновому), то они кодируют одну и ту же аминокислоту.

    Однако из этого идеального правила есть два исключения. Это кодон АUА, который должен соответствовать не изолейцину, а метионину и кодон UGА, который является терминирующим, тогда как должен соответствовать триптофану. Вырожденность кода имеет, очевидно, приспособительное значение.

  8. Универсальность - все перечисленные выше свойства генетического кода характерны для всех живых организмов.
    Кодон Универсальный код Митохондриальные коды
    Позвоночные Беспозвоночные Дрожжи Растения
    UGA STOP Trp Trp Trp STOP
    AUA Ile Met Met Met Ile
    CUA Leu Leu Leu Thr Leu
    AGA Arg STOP Ser Arg Arg
    AGG Arg STOP Ser Arg Arg

    В последнее время принцип универсальности кода был поколеблен в связи c открытием Береллом в 1979 г. идеального кода митохондрий человека, в котором выполняется правило вырожденности кода. В коде митохондрий кодон UGA соответствует триптофану, а AUA - метионину, как того требует правило вырожденности кода.

    Возможно, в начале эволюции у всех простейших организмов был такой же код, как и у митохондрий, а затем он претерпел небольшие отклонения.

  9. Неперекрываемость - каждый из триплетов генетического текста независим друг от друга, один нуклеотид входит в состав только одного триплета; На рис. показана разница между перекрывающимся и неперекрывающимся кодом.

    В 1976г. была секвенирована ДНК фага φХ174. У него одноцепочечная кольцевая ДНК, состоящая из 5375 нуклеотидов. Было известно, что фаг кодирует 9 белков. Для 6 из них были определены гены, располагающиеся друг за другом.

    Выяснилось, что есть перекрывание. Ген Е полностью находится внутри гена D. Его инициирующий кодон появляется в результате сдвига считывания на один нуклеотид. Ген J начинается там, где кончается ген D. Инициирующий кодон гена J перекрывается с терминирующим кодоном гена D в результате сдвига на два нуклеотида. Конструкция называется "сдвиг рамки считывания" на число нуклеотидов, некратное трем. На сегодняшний день перекрывание показано только для нескольких фагов.

  10. Помехоустойчивость - отношение числа консервативных замен к числу радикальных замен.

    Мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными. Мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными.

    Так как одна и та же аминокислота может кодироваться разными триплетами, то некоторые замены в триплетах не приводят к замене кодируемой аминокислоты (например UUU -> UUC оставляет фенилаланин). Некоторые замены меняют аминокислоту на другую из того же класса (неполярный, полярный, основной, кислотный), остальные замены меняют и класс аминокислоты.

    В каждом триплете можно провести 9 однократных замен, т.е. выбрать, какую из позиций меняем - можно тремя способами (1-я или 2-я или 3-я), причем выбранную букву (нуклеотид) можно поменять на 4-1=3 других буквы (нуклеотида). Общее количество возможных замен нуклеотидов - 61 по 9 = 549.

    Прямым подсчетом по таблице генетического кода можно убедиться, что из них: 23 замены нуклеотидов приводят к появлению кодонов - терминаторов трансляции. 134 замены не меняют кодируемую аминокислоту. 230 замен не меняют класс кодируемой аминокислоты. 162 замены приводят к смене класса аминокислоты, т.е. являются радикальными. Из 183 замен 3-его нуклеотида, 7 приводят к появлению терминаторов трансляции, а 176 - консервативны. Из 183 замен 1-ого нуклеотида, 9 приводят к появлению терминаторов, 114 - консервативны и 60 - радикальны. Из 183 замен 2-го нуклеотида, 7 приводят к появлению терминаторов, 74 - консервативны, 102 - радикальны.


Генетический код, выраженный в кодонах, это система кодирования информации о строении белков, присущая всем живым организмам планеты. Его расшифровка заняла десятилетие, а вот то, что он существует, наука понимала почти столетие. Универсальность, специфичность, однонаправленность, а особенно вырожденность генетического кода имеют важное биологическое значение.

История открытий

Проблема кодирования всегда была ключевой в биологии. К матричному строению генетического кода наука продвигалась довольно неспешно. С момента обнаружения Дж. Уотсоном и Ф. Криком в 1953 году двойной спиральной структуры ДНК начался этап разгадывания самой структуры кода, который побудил веру в величие природы. Линейная структура белков и такая же структура ДНК подразумевала наличие генетического кода как соответствия двух текстов, но записанных при помощи разных алфавитов. И если алфавит белков был известен, то знаки ДНК стали предметом изучения биологов, физиков и математиков.

Нет смысла описывать все шаги в решении этой загадки. Прямой эксперимент, доказавший и подтвердивший, что между кодонами ДНК и аминокислотами белка существует четкая и последовательная соответственность, провели в 1964 году Ч. Яновски и С. Бреннер. А далее - период расшифровки генетического кода in vitro (в пробирке) с использованием техник синтеза белка в бесклеточных структурах.

Полностью расшифрованный код E. Coli был обнародован в 1966 году на симпозиуме биологов в Колд-Спринг-Харборе (США). Тогда и открылась избыточность (вырожденность) генетического кода. Что это значит, объяснилось довольно просто.

Раскодирование продолжается

Получение данных о расшифровке наследственного кода стало одним из самых значительных событий прошлого столетия. Сегодня наука продолжает углубленно исследовать механизмы молекулярных кодировок и его системных особенностей и переизбытка знаков, в чем выражается свойство вырожденности генетического кода. Отдельная отрасль изучения - возникновение и эволюционирование системы кодирования наследственного материала. Доказательства связи полинуклеотидов (ДНК) и полипептидов (белки) дали толчок развитию молекулярной биологии. А та, в свою очередь, биотехнологиям, биоинженерии, открытиям в селекции и растениеводстве.

Догмы и правила

Главная догма молекулярной биологии - информация передается с ДНК на информационную РНК, а после с нее на белок. В обратном направлении передача возможна с РНК на ДНК и с РНК на другую РНК.

Но матрицей или основой всегда остается ДНК. И все остальные фундаментальные особенности передачи информации - это отражение этого матричного характера передачи. А именно передачи путем осуществления синтеза на матрице других молекул, которые и станут структурой воспроизводства наследственной информации.

Генетический код

Линейное кодирование структуры белковых молекул осуществляется с помощью комплементарных кодонов (триплетов) нуклеотидов, которых всего 4 (адеин, гуанин, цитозин, тимин (урацил)), что спонтанно приводит к образованию другой цепочки нуклеотидов. Одинаковое число и химическая комплиментарность нуклеотидов - это главное условие такого синтеза. Но при образовании белковой молекулы качества соответствия количества и качества мономеров нет (ДНК нуклеотиды - аминокислоты белка). Это и есть природный наследственный код - система записи в последовательности нуклеотидов (кодонах) последовательности аминокислот в белке.

Генетический код обладает несколькими свойствами:

  • Триплетность.
  • Однозначность.
  • Направленность.
  • Неперекрываемость.
  • Избыточность (вырожденность) генетического кода.
  • Универсальность.

Приведем краткую характеристику, концентрируя внимание на биологическом значении.

Триплетность, непрерывность и наличие стоп-сигналов

Каждой из 61 аминокислоты соответствует один смысловой триплет (тройка) нуклеотидов. Три триплета не несут информацию об аминокислоте и являются стоп-кодонами. Каждый нуклеотид в цепочке входит в состав триплета, а не существует сам по себе. В конце и в начале цепочки нуклеотидов, отвечающих за один белок, находятся стоп-кодоны. Они запускают или останавливают трансляцию (синтез белковой молекулы).

Специфичность, неперекрываемость и однонаправленность

Каждый кодон (триплет) кодирует только одну аминокислоту. Каждый триплет не зависит от соседнего и не перекрывается. Один нуклеотид может входить только в один триплет в цепочке. Синтез белка идет всегда только в одном направлении, что регулируют стоп-кодоны.

Избыточности генетического кода

Каждый триплет нуклеотидов кодирует одну аминокислоту. Всего 64 нуклеотида, из них 61 - кодируют аминокислоты (смысловые кодоны), а три - бессмысленные, то есть аминокислоту не кодируют (стоп-кодоны). Избыточность (вырожденность) генетического кода заключается в том, что в каждом триплете могут быть произведены замены - радикальные (приводят к замене аминокислоты) и консервативные (не меняют класс аминокислоты). Легко посчитать, что если в триплете можно провести 9 замен (1, 2 и 3 позиция), каждый нуклеотид можно заменить на 4 - 1 = 3 других варианта, то общее количество возможных вариантов замен нуклеотида будет 61 по 9 = 549.

Вырожденность генетического кода проявляется в том, что 549 вариантов - это намного больше, чем необходимо для закодировки информации о 21 аминокислоте. При этом из 549 вариантов 23 замены приведут к образованию стоп-кодонов, 134 + 230 замены - консервативны, и 162 замены - радикальны.

Правило вырожденности и исключения

Если два кодона имеют два одинаковых первых нуклеотида, а оставшиеся представлены нуклеотидами одного класса (пуриновые или пиримидиновые), то они несут информацию об одной и той же аминокислоте. Это и есть правило вырожденности или избыточности генетического кода. Два исключения - АУА и УГА - первый кодирует метионин, хотя должен был бы изолейцин, а второй - стоп-кодон, хотя должен был бы кодировать триптофан.

Значение вырожденности и универсальности

Именно эти два свойства генетического кода имеют наибольшее биологическое значение. Все свойства, перечисленные выше, характерны для наследственной информации всех форм живых организмов на нашей планете.

Вырожденность генетического кода имеет приспособительное значение, как многократное дублирование кода одной аминокислоты. Кроме того, это означает снижение значимости (вырождение) третьего нуклеотида в кодоне. Такой вариант сводит к минимуму мутационные повреждения в ДНК, которые повлекут за собой грубые нарушения в структуре белка. Это защитный механизм живых организмов планеты.

Генетический код – это система записи наследственной информации в молекулах нуклеиновых кислот, основанная на определённом чередовании последовательностей нуклеотидов в ДНК или РНК, образующих кодоны, соответствующие аминокислотам в белке.

Свойства генетического кода.

Генетический код имеет несколько свойств.

    Триплетность.

    Вырожденность или избыточность.

    Однозначность.

    Полярность.

    Неперекрываемость.

    Компактность.

    Универсальность.

Следует отметить, что некоторые авторы предлагают ещё и другие свойства кода, связанные с химическими особенностями входящих в код нуклеотидов или с частотой встречаемости отдельных аминокислот в белках организма и т.д. Однако эти свойство вытекают из вышеперечисленных, поэтому там мы их и рассмотрим.

а. Триплетность. Генетический код, как и многое сложно организованные система имеет наименьшую структурную и наименьшую функциональную единицу. Триплет – наименьшая структурная единица генетического кода. Состоит она из трёх нуклеотидов. Кодон – наименьшая функциональная единица генетического кода. Как правило, кодонами называют триплеты иРНК. В генетическом коде кодон выполняет несколько функций. Во-первых, главная его функция заключается в том, что он кодирует одну аминокислоту. Во-вторых, кодон может не кодировать аминокислоту, но, в этом случае, он выполняет другую функцию (см. далее). Как видно из определения, триплет – это понятие, которое характеризует элементарную структурную единицу генетического кода (три нуклеотидов). Кодон – характеризует элементарную смысловую единицу генома – три нуклеотида определяют присоединение к полипептидной цепочки одной аминокислоты.

Элементарную структурную единицу вначале расшифровали теоретически, а затем её существование подтвердили экспериментально. И действительно, 20 аминокислот невозможно закодировать одним или двумя нуклеотидом т.к. последних всего 4. Три нуклеотида из четырёх дают 4 3 = 64 варианта, что с избытком перекрывает число имеющихся у живых организмах аминокислот (см.табл. 1).

Представленные в таблице 64 сочетания нуклеотидов имеют две особенности. Во-первых, из 64 вариантов триплетов только 61 являются кодонами и кодируют какую либо аминокислоту, их называют смысловые кодоны . Три триплета не кодируют

аминокислот а являются стоп-сигналами, обозначающие конец трансляции. Таких триплетов три – УАА, УАГ, УГА , их ещё называют «бессмысленные» (нонсенс кодоны). В результате мутации, которая связана с заменой в триплете одного нуклеотида на другой, из смыслового кодона может возникнуть бессмысленный кодон. Такой тип мутации называютнонсенс-мутация . Если такой стоп-сигнал сформировался внутри гена (в его информационной части), то при синтезе белка в этом месте процесс будет постоянно прерываться – синтезироваться будет только первая (до стоп-сигнала) часть белка. У человека с такой патологией будет ощущаться нехватка белка и возникнут симптомы, связанные с этой нехваткой. Например, такого рода мутация выявлена в гене, кодирующем бета-цепь гемоглобина. Синтезируется укороченная неактивная цепь гемоглобина, которая быстро разрушается. В результате формируется молекула гемоглобина лишённая бета-цепи. Понятно, что такая молекула вряд ли будет полноценно выполнять свои обязанности. Возникает тяжёлое заболевания, развивающееся по типу гемолитической анемии (бета-ноль талассемия, от греческого слова «Таласа» — Средиземное море, где эта болезнь впервые обнаружена).

Механизм действия стоп-кодонов отличается от механизма действия смысловых кодонов. Это следует из того, что для всех кодоны, кодирующие аминокислоты, найдены соответствующие тРНК. Для нонсенс-кодонов тРНК не найдены. Следовательно, в процессе остановки синтеза белка тРНК не принимает участие.

Кодон АУГ (у бактерий иногда ГУГ) не только кодируют аминокислоту метионин и валин, но и является инициатором трансляции .

б. Вырожденность или избыточность.

61 из 64 триплетов кодируют 20 аминокислот. Такое трёхразовое превышение числа триплетов над количеством аминокислот позволяет предположить, что в переносе информации могут быть использованы два варианта кодирования. Во-первых, не все 64 кодона могут быть задействованы в кодировании 20 аминокислот, а только 20 и, во-вторых, аминокислоты могут кодироваться несколькими кодонами. Исследования показали, что природа использовала последний вариант.

Его предпочтение очевидно. Если бы из 64 варианта триплетов в кодировании аминокислот участвовало только 20, то 44 триплета (из 64) оставались бы не кодирующими, т.е. бессмысленными (нонсенс-кодонами). Ранее мы указывали, насколько опасно для жизнедеятельности клетки превращение кодирующего триплета в результате мутации в нонсенс-кодон — это существенно нарушает нормальную работу РНК-полимеразы, приводя в конечном итоге к развитию заболеваний. В настоящее время в нашем геноме три кодона являются бессмысленными, а теперь представьте, что было бы если число нонсенс-кодонов увеличится в примерно в 15 раз. Понятно, что в такой ситуации переход нормальных кодонов в нонсенс-кодоны будет неизмеримо выше.

Код, при котором одна аминокислота кодируется несколькими триплетами, называется вырожденным или избыточным. Почти каждой аминокислоте соответствует несколько кодонов. Так, аминокислота лейцин может кодироваться шестью триплетами - УУА, УУГ, ЦУУ, ЦУЦ, ЦУА, ЦУГ. Валин кодируется четырьмя триплетами, фенилаланин - двумя и только триптофан и метионин кодируются одним кодоном. Свойство, которое связано с записью одной и той же информации разными символами носит названиевырожденность.

Число кодонов, предназначенных для одной аминокислоты, хорошо коррелируется с частотой встречаемости аминокислоты в белках.

И это, скорее всего, не случайно. Чем больше частота встречаемости аминокислоты в белке, тем чаще представлен кодон этой аминокислоты в геноме, тем выше вероятность его повреждения мутагенными факторами. Поэтому понятно, что мутированный кодон имеет больше шансов кодировать туже аминокислоту при высокой его вырожденности. С этих позиций вырожденность генетического кода является механизмом защищающим геном человека от повреждений.

Необходимо отметить, что термин вырожденность используется в молекулярной генетики и в другом смысле. Так основная часть информации в кодоне приходится на первые два нуклеотида, основание в третьем положении кодона оказывается малосущественным. Этот феномен называют “вырожденностью третьего основания”. Последняя особенность сводит до минимума эффект мутаций. Например, известно, что основной функцией эритроцитов крови является перенос кислорода от легких к тканям и углекислого газа от тканей к легким. Осуществляет эту функцию дыхательный пигмент - гемоглобин, который заполняет всю цитоплазму эритроцита. Состоит он из белковой части – глобина, который кодируется соответствующим геном. Кроме белка в молекулу гемоглобина входит гем, содержащий железо. Мутации в глобиновых генах приводят к появлению различных вариантов гемоглобинов. Чаще всего мутации связаны с заменой одного нуклеотида на другой и появлением в гене нового кодона , который может кодировать новую аминокислоту в полипептидной цепи гемоглобина. В триплете, в результате мутации может быть заменён любой нуклеотид – первый, второй или третий. Известно несколько сотен мутаций, затрагивающих целостность генов глобина. Около400 из них связаны с заменой единичных нуклеотидов в гене и соответствующей аминокислотной заменой в полипептиде. Из них только100 замен приводят к нестабильности гемоглобина и различного рода заболеваниям от легких до очень тяжелых. 300 (примерно 64%) мутаций-замен не влияют на функцию гемоглобина и не приводят к патологии. Одной из причин этого является упомянутая выше “вырожденность третьего основания”, когда замена третьего нуклеотида в триплете кодирующем серин, лейцин, пролин, аргинин и некоторые другие аминокислоты приводит к появлению кодона-синонима, кодирующего ту же аминокислоту. Фенотипически такая мутация не проявится. В отличие от этого любая замена первого или второго нуклеотида в триплете в 100 % случаях приводит к появлению нового варианта гемоглобина. Но и в этом случае тяжёлых фенотипических нарушений может и не быть. Причиной этому является замена аминокислоты в гемоглобине на другую сходную с первой по физико-химическим свойствам. Например, если аминокислота, обладающая гидрофильными свойствами, заменена на другую аминокислоту, но с такими же свойствами.

Гемоглобин состоит из железопорфириновой группы гема (к ней и присоединяются молекулы кислорода и углекислоты) и белка - глобина. Гемоглобин взрослого человека (НвА) содержит две идентичные -цепи и две -цепи. Молекула -цепи содержит 141 аминокислотных остатков, -цепочка - 146, — и -цепи различаются по многим аминокислотным остаткам. Аминокислотная последовательность каждой глобиновой цепи кодируется своим собственным геном. Ген, кодирующий -цепь располагается в коротком плече 16 хромосомы, -ген - в коротком плече 11 хромосомы. Замена в гене, кодирующем -цепь гемоглобина первого или второго нуклеотида практически всегда приводит к появлению в белка новых аминокислот, нарушению функций гемоглобина и тяжёлым последствия для больного. Например, замена “Ц” в одном из триплетов ЦАУ (гистидин) на “У” - приведет к появлению нового триплета УАУ, кодирующего другую аминокислоту - тирозин Фенотипически это проявится в тяжёлом заболевании.. Аналогичная замена в 63 положении -цепи полипептида гистидина на тирозин приведет к дестабилизации гемоглобина. Развивается заболевание метгемоглобинемия. Замена, в результате мутации, глутаминовой кислоты на валин в 6-м положении -цепи является причиной тяжелейшего заболевания - серповидно-клеточной анемии. Не будем продолжать печальный список. Отметим только, что при замене первых двух нуклеотидов может появится аминокислота по физико-химическим свойствам похожая на прежнюю. Так, замена 2-го нуклеотида в одном из триплетов, кодирующего глутаминовую кислоту (ГАА) в -цепи на “У” приводит к появлению нового триплета (ГУА), кодирующего валин, а замена первого нуклеотида на “А” формирует триплет ААА, кодирующий аминокислоту лизин. Глутаминовая кислота и лизин сходны по физико-химическим свойствам - они обе гидрофильны. Валин - гидрофобная аминокислота. Поэтому, замена гидрофильной глютаминовой кислоты на гидрофобный валин, значительно меняет свойства гемоглобина, что, в конечном итоге, приводит к развитию серповидноклеточной анемии, замена же гидрофильной глютаминовой кислоты на гидрофильный лизин в меньшей степени меняет функцию гемоглобина - у больных возникает легкая форма малокровия. В результате замены третьего основания новый триплет может кодировать туже аминокислоты, что и прежней. Например, если в триплете ЦАУ урацил был заменён на цитозин и возник триплет ЦАЦ, то практически никаких фенотипических изменений у человека выявлено не будет. Это понятно, т.к. оба триплета кодируют одну и туже аминокислоту – гистидин.

В заключении уместно подчеркнуть, что вырожденность генетического кода и вырожденность третьего основания с общебиологических позиция являются защитными механизмами, которые заложены в эволюции в уникальной структуре ДНК и РНК.

в. Однозначность.

Каждый триплет (кроме бессмысленных) кодирует только одну аминокислоту. Таким образом, в направлении кодон – аминокислота генетический код однозначен, в направлении аминокислота – кодон – неоднозначен (вырожденный).

Однозначен

Кодон аминокислота

Вырожденный

И в этом случае необходимость однозначности в генетическом коде очевидна. При другом варианте при трансляции одного и того же кодона в белковую цепочку встраивались бы разные аминокислоты и в итоге формировались белков с различной первичной структурой и разной функцией. Метаболизм клетки перешёл бы в режим работы «один ген – несколько поипептидов». Понятно, что в такой ситуации регулирующая функция генов была бы полностью утрачена.

г. Полярность

Считывание информации с ДНК и с иРНК происходит только в одном направлении. Полярность имеет важное значение для определения структур высшего порядка (вторичной, третичной и т.д.). Ранее мы говорили о том, что структуры низшего порядка определяют структуры более высшего порядка. Третичная структура и структуры более высокого порядка у белков, формируются сразу же как только синтезированная цепочка РНК отходит от молекулы ДНК или цепочка полипептида отходит от рибосомы. В то время когда свободный конец РНК или полипептида приобретает третичную структуру, другой конец цепочки ещё продолжает синтезироваться на ДНК (если транскрибируется РНК) или рибосоме (если транскрибируется полипептид).

Поэтому однонаправленный процесс считывания информации (при синтезе РНК и белка) имеет существенное значение не только для определения последовательности нуклеотидов или аминокислот в синтезируемом веществе, но для жёсткой детерминации вторичной, третичной и т.д. структур.

д. Неперекрываемость.

Код может быть перекрывающимся и не перекрывающимся. У большинства организмов код не перекрывающийся. Перекрывающийся код найден у некоторых фагов.

Сущность не перекрывающего кода заключается в том, что нуклеотид одного кодона не может быть одновременно нуклеотидом другого кодона. Если бы код был перекрывающим, то последовательность из семи нуклеотидов (ГЦУГЦУГ) могла кодировать не две аминокислоты (аланин-аланин) (рис.33,А) как в случае с не перекрывающимся кодом, а три (если общим является один нуклеотид) (рис. 33, Б) или пять (если общими являются два нуклеотида) (см. рис. 33, В). В последних двух случаях мутация любого нуклеотида привела бы к нарушению в последовательности двух, трёх и т.д. аминокислот.

Однако установлено, что мутация одного нуклеотида всегда нарушает включение в полипептид одной аминокислоты. Это существенный довод в пользу того, что код является не перекрывающимся.

Поясним это на рисунке 34. Жирными линиями показаны триплеты кодирующие аминокислоты в случае не перекрывающегося и перекрывающегося кода. Эксперименты однозначно показали, что генетический код является не перекрывающимся. Не вдаваясь в детали эксперимента отметим, что если заменить в последовательности нуклеотидов (см. рис.34) третий нуклеотид У (отмечен звёздочкой) на какой-либо другой то:

1. При неперекрывающемся коде контролируемый этой последовательностью белок имел бы замену одной (первой) аминокислоте (отмечена звёздочками).

2. При перекрывающемся коде в варианте А произошла бы замена в двух (первой и второй) аминокислотах (отмечены звёздочками). При варианте Б замена коснулась бы трёх аминокислот (отмечены звёздочками).

Однако многочисленные опыты показали, что при нарушении одного нуклеотида в ДНК, нарушения в белке всегда касаются только одной аминокислоты, что характерно для неперекрывающегося кода.

ГЦУГЦУГ ГЦУГЦУГ ГЦУГЦУГ

ГЦУ ГЦУ ГЦУ УГЦ ЦУГ ГЦУ ЦУГ УГЦ ГЦУ ЦУГ

*** *** *** *** *** ***

Аланин – Аланин Ала – Цис – Лей Ала – Лей – Лей – Ала – Лей

А Б В

Не перекрывающийся код Перекрывающийся код

Рис. 34. Схема, объясняющая наличие в геноме не перекрывающегося кода (объяснение в тексте).

Неперекрываемость генетического кода связана с ещё одним свойством – считывание информации начинается с определённой точки – сигнала инициации. Таким сигналом инициации в иРНК является кодон, кодирующий метионин АУГ.

Следует отметить, что у человека всё-таки имеется небольшое число генов, которые отступают от общего правила и перекрываются.

е. Компактность.

Между кодонами нет знаков препинания. Иными словами триплеты не отделены друг от друга, например, одним ничего не значащим нуклеотидом. Отсутствие в генетической коде «знаков препинания» было доказано в экспериментах.

ж. Универсальность.

Код един для всех организмов живущих на Земле. Прямое доказательство универсальности генетического кода было получено при сравнении последовательностей ДНК с соответствующими белковыми последовательностями. Оказалось, что во всех бактериальных и эукариотических геномах используется одни и те же наборы кодовых значений. Есть и исключения, но их не много.

Первые исключения из универсальности генетического кода были обнаружены в митохондриях некоторых видов животных. Это касалось кодона терминатора УГА, который читался так же как кодон УГГ, кодирующий аминокислоту триптофан. Были найдены и другие более редкие отклонения от универсальности.

Кодовая система ДНК.

Генетический код днк состоит из 64 триплетов нуклеотидов. Эти триплеты называют кодонами. Каждый кодон кодирует одну из 20 аминокислот, используемых в синтезе белков. Это дает некоторую избыточность в коде: большинство аминокислот кодируется более чем одним кодоном.
Один кодон выполняет две взаимосвязанные функции: сигнализирует о начале перевода и кодирует включения аминокислоты метионина (Met) в растущую полипептидную цепь. Кодовая система днк устроена так, что генетический код может быть выражен либо как РНК-кодонами, либо кодонамиДНК. РНК-кодоны встречаются в РНК (мРНК) и эти кодоны способны читать информацию в процессе синтеза полипептидов (процесс, называемый переводом). Но каждая молекула мРНК приобретает последовательность нуклеотидов в транскрипции с соответствующего гена.

Все, кроме двух аминокислот (Met и Trp) могут быть закодированы посредством от 2 до 6 различных кодонов. Тем не менее, геном большинства организмов показывает, что определенные кодоны предпочтительны по сравнению с другими. У человека, например, аланин кодируется GCC четыре раза чаще, чем в GCG. Это, вероятно, свидетельствует о большей эффективности перевода аппарата трансляции (например, рибосомы) для некоторых кодонов.

Генетический код является почти универсальным. Те же кодоны назначены на тот же участок аминокислот и тем же сигналы пуска и остановки в подавляющем большинстве совпадают у животных, растений и микроорганизмов. Тем не менее, некоторые исключения были найдены. Большинство из них включают назначение одного или двух из трех стоп-кодонов к аминокислоте.

Ген - структурная и функциональная единица наследственности, контролирующая развитие определенного признака или свойства. Совокупность генов родители передают потомкам во время размножения.Большой вклад в изучение гена внесли российские учёные: Симашкевич Е.А.,Гаврилова Ю.А.,Богомазова О.В.(2011 год)

В настоящее время, в молекулярной биологии установлено, что гены - это участки ДНК, несущие какую-либо целостную информацию - о строении одной молекулы белка или одной молекулы РНК. Эти и другие функциональные молекулы определяют развитие, рост и функционирование организма.

В то же время, каждый ген характеризуется рядом специфических регуляторных последовательностей ДНК, таких как промоторы, которые принимают непосредственное участие в регулировании проявления гена. Регуляторные последовательности могут находиться как в непосредственной близости от открытой рамки считывания, кодирующей белок, или начала последовательности РНК, как в случае с промоторами (так называемые cis cis-regulatory elements ), так и на расстоянии многих миллионов пар оснований (нуклеотидов), как в случае с энхансерами, инсуляторами и супрессорами (иногда классифицируемые как trans -регуляторные элементы, англ. trans-regulatory elements ). Таким образом, понятие гена не ограничено только кодирующим участком ДНК, а представляет собой более широкую концепцию, включающую в себя и регуляторные последовательности.

Изначально термин ген появился как теоретическая единица передачи дискретной наследственной информации. История биологии помнит споры о том, какие молекулы могут являться носителями наследственной информации. Большинство исследователей считали, что такими носителями могут быть только белки, так как их строение (20 аминокислот) позволяет создать больше вариантов, чем строение ДНК, которое составлено всего из четырёх видов нуклеотидов. Позже было экспериментально доказано, что именно ДНК включает в себя наследственную информацию, что было выражено в виде центральной догмы молекулярной биологии.

Гены могут подвергаться мутациям - случайным или целенаправленным изменениям последовательности нуклеотидов в цепи ДНК. Мутации могут приводить к изменению последовательности, а следовательно изменению биологических характеристик белка или РНК, которые, в свою очередь, могут иметь результатом общее или локальное изменённое или анормальное функционирование организма. Такие мутации в ряде случаев являются патогенными, так как их результатом является заболевание, или летальными на эмбриональном уровне. Однако, далеко не все изменения последовательности нуклеотидов приводят к изменению структуры белка (благодаря эффекту вырожденности генетического кода) или к существенному изменению последовательности и не являются патогенными. В частности, геном человека характеризуется однонуклеотидными полиморфизмами и вариациями числа копий (англ. copy number variations ), такими как делеции и дупликации, которые составляют около 1 % всей нуклеотидной последовательности человека. Однонуклеотидные полиморфизмы, в частности, определяют различные аллели одного гена.

Мономеры, составляющие каждую из цепей ДНК, представляют собой сложные органические соединения, включающие в себя азотистые основания: аденин(А) или тимин(Т) или цитозин(Ц) или гуанин(Г), пятиатомный сахар-пентозу-дезоксирибозу,по имени которой и получила название сама ДНК, а так же остаток фосфорной кислоты.Эти соединения носят название нуклеотидов.

Свойства гена

  1. дискретность - несмешиваемость генов;
  2. стабильность - способность сохранять структуру;
  3. лабильность - способность многократно мутировать;
  4. множественный аллелизм - многие гены существуют в популяции во множестве молекулярных форм;
  5. аллельность - в генотипе диплоидных организмов только две формы гена;
  6. специфичность - каждый ген кодирует свой признак;
  7. плейотропия - множественный эффект гена;
  8. экспрессивность - степень выраженности гена в признаке;
  9. пенетрантность - частота проявления гена в фенотипе;
  10. амплификация - увеличение количества копий гена.

Классификация

  1. Структурные гены - уникальные компоненты генома, представляющие единственную последовательность, кодирующую определенный белок или некоторые виды РНК. (См. также статью гены домашнего хозяйства).
  2. Функциональные гены - регулируют работу структурных генов.

Генети́ческий код - свойственный всем живым организмам способ кодирования аминокислотной последовательности белков при помощи последовательности нуклеотидов.

В ДНК используется четыре нуклеотида - аденин (А), гуанин (G), цитозин (С), тимин (T), которые в русскоязычной литературе обозначаются буквами А, Г, Ц и Т. Эти буквы составляют алфавит генетического кода. В РНК используются те же нуклеотиды, за исключением тимина, который заменён похожим нуклеотидом - урацилом, который обозначается буквой U (У в русскоязычной литературе). В молекулах ДНК и РНК нуклеотиды выстраиваются в цепочки и, таким образом, получаются последовательности генетических букв.

Генетический код

Для построения белков в природе используется 20 различных аминокислот. Каждый белок представляет собой цепочку или несколько цепочек аминокислот в строго определённой последовательности. Эта последовательность определяет строение белка, а следовательно все его биологические свойства. Набор аминокислот также универсален почти для всех живых организмов.

Реализация генетической информации в живых клетках (то есть синтез белка, кодируемого геном) осуществляется при помощи двух матричных процессов: транскрипции (то есть синтеза мРНК на матрице ДНК) и трансляции генетического кода в аминокислотную последовательность (синтез полипептидной цепи на мРНК). Для кодирования 20 аминокислот, а также сигнала «стоп», означающего конец белковой последовательности, достаточно трёх последовательных нуклеотидов. Набор из трёх нуклеотидов называется триплетом. Принятые сокращения, соответствующие аминокислотам и кодонам, изображены на рисунке.

Свойства

  1. Триплетность - значащей единицей кода является сочетание трёх нуклеотидов (триплет, или кодон).
  2. Непрерывность - между триплетами нет знаков препинания, то есть информация считывается непрерывно.
  3. Неперекрываемость - один и тот же нуклеотид не может входить одновременно в состав двух или более триплетов (не соблюдается для некоторых перекрывающихся генов вирусов, митохондрий и бактерий, которые кодируют несколько белков, считывающихся со сдвигом рамки).
  4. Однозначность (специфичность) - определённый кодон соответствует только одной аминокислоте (однако, кодон UGA у Euplotes crassus кодирует две аминокислоты - цистеин и селеноцистеин)
  5. Вырожденность (избыточность) - одной и той же аминокислоте может соответствовать несколько кодонов.
  6. Универсальность - генетический код работает одинаково в организмах разного уровня сложности - от вирусов до человека (на этом основаны методы генной инженерии; есть ряд исключений, показанный в таблице раздела «Вариации стандартного генетического кода» ниже).
  7. Помехоустойчивость - мутации замен нуклеотидов, не приводящие к смене класса кодируемой аминокислоты, называют консервативными ; мутации замен нуклеотидов, приводящие к смене класса кодируемой аминокислоты, называют радикальными .

Биосинтез белка и его этапы

Биосинтез белка - сложный многостадийный процесс синтеза полипептидной цепи из аминокислотных остатков, происходящий на рибосомах клеток живых организмов с участием молекул мРНК и тРНК.

Биосинтез белка можно разделить на стадии транскрипции, процессинга и трансляции. Во время транскрипции происходит считывание генетической информации, зашифрованной в молекулах ДНК, и запись этой информации в молекулы мРНК. В ходе ряда последовательных стадий процессинга из мРНК удаляются некоторые фрагменты, ненужные в последующих стадиях, и происходит редактирование нуклеотидных последовательностей. После транспортировки кода из ядра к рибосомам происходит собственно синтез белковых молекул, путём присоединения отдельных аминокислотных остатков к растущей полипептидной цепи.

Между транскрипцией и трансляцией молекула мРНК претерпевает ряд последовательных изменений, которые обеспечивают созревание функционирующей матрицы для синтеза полипептидной цепочки. К 5΄-концу присоединяется кэп, а к 3΄-концу поли-А хвост, который увеличивает длительность жизни мРНК. С появлением процессинга в эукариотической клетке стало возможно комбинирование экзонов гена для получения большего разнообразия белков, кодируемым единой последовательностью нуклеотидов ДНК, - альтернативный сплайсинг.

Трансляция заключается в синтезе полипептидной цепи в соответствии с информацией, закодированной в матричной РНК. Аминокислотная последовательность выстраивается при помощи транспортных РНК (тРНК), которые образуют с аминокислотами комплексы - аминоацил-тРНК. Каждой аминокислоте соответствует своя тРНК, имеющая соответствующий антикодон, «подходящий» к кодону мРНК. Во время трансляции рибосома движется вдоль мРНК, по мере этого наращивается полипептидная цепь. Энергией биосинтез белка обеспечивается за счёт АТФ.

Готовая белковая молекула затем отщепляется от рибосомы и транспортируется в нужное место клетки. Для достижения своего активного состояния некоторые белки требуют дополнительной посттрансляционной модификации.