Исходные данные о генетическом коде



Скачать 445.76 Kb.
страница1/5
Дата19.01.2013
Размер445.76 Kb.
ТипДокументы
  1   2   3   4   5
Числа Фибоначчи и генетический код
Исходные данные о генетическом коде

Среди понятий биологии, хорошо формализованных и имеющих уровень общенаучной значимости, генетический код занимает особое место. Воспользуемся данными о генетическом коде, приведенными в замечательной книге "Бипериодическая таблица генетического кода и число протонов" (2001 г.), написанной известным русским ученым Сергеем Валентиновичем Петуховым, работающим на стыке биологии и математики.



С.В. Петухов "Бипериодическая таблица генетического кода и число протонов" (2001 г.).

Установление наукой ныне широко известного факта поразительной простоты основных принципов кодирования наследственной информации в живых организмах относится к числу важнейших открытий человечества.

Эта простота заключается в том, что наследственная информация кодируется текстами из трехбуквенных слов - триплетов или кодонов, составленных на базе алфавита из четырех букв - азотистых оснований А (аденин), С (цитозин), G (гуанин), T (тимин). Данная система записи по существу едина для всего необозримого множества разнообразных живых организмов и называется генетическим кодом.

Хранителем триплетов генетического кода является всем известная "двойная спираль" Уотсона-Крика, представляющая молекулу ДНК, состоящая из двух взаимосвязанных параллельных цепей. Стандартизованные звенья этих цепей называются нуклеотидами. Вдоль каждой из цепей расставлены - по одному на каждый нуклеотид - указанные выше азотистые основания A, C, G и Т. При этом для двух цепей ДНК выполняется так называемое условие комплементарности: против основания А в одной цепи всегда стоит Т в другой, а против основания G всегда стоит С.

С помощью трехбуквенных триплетов или кодонов осуществляется кодирование 20 аминокислот. Различных комбинаций по три основания из четырех существует 43 = 64. В этой связи некоторые из 20 видов аминокислот кодируются сразу несколькими триплетами. Это называется вырожденностью кода. Нахождение соответствия между триплетами и аминокислотами (или знаками пунктуации для считывания) обычно трактуется как расшифровка генетического кода.

Рибонуклеиновая кислота (РНК) выполняет роль "посредника" в синтезе белков из аминокислот 20 видов в соответствии с последовательностью триплетов в цепях ДНК. Известным отличием РНК от ДНК является то, что стандартный набор азотистых оснований ее триплетов содержит вместо тимина (Т) очень сходный и родственный с ним урацил (U), а потому четырехбуквенный кодовый алфавит у РНК состоит из набора А, С, G, U.

Азотистые основания в ДНК и РНК относятся к двум различным химическим классам - пиримидиновому и пуриновому. Пиримидиновыми основаниями являются цитозин С и урацил U (или тимин Т), а пуриновыми - аденин А и гуанин G.
Под действием азотистой кислоты наблюдаются закономерные мутации РНК, связанные с заменой оснований: A ® G, C ® U. Таким образом, основания А и С являются изменяющимися, а G и U - неизменяющимися.

Белки или протеины - это основной плотный компонент живого организма. Каждый из белков выполняет только свою, свойственную ему функцию. Белки представляют собой крупные полимерные молекулы, состоящие из цепей аминокислот (полипептидов), нерегулярно чередующихся. Все аминокислоты в белках соединены друг с другом однотипной химической связью, получившей название пептидной связи. Молекулу белка часто сравнивают с поездом, состоящим из вагонов двадцати различных видов, которые сцеплены друг с другом одним и тем же способом, позволяющим соединять вагоны в любом порядке.

Бипериодическая Таблица генетического кода

Множество из 64 триплетов генетического кода представляет собой некоторую структурированную систему в силу того, что четыре азотистых основания генетического кода (А, С, G, U) подразделяются, во-первых на пары пуриновых и пиримидиновых оснований, во-вторых, на комплементарные пары и, в-третьих, на пары оснований мутирующих и не мутирующих под действием азотистой кислоты. По этой причине каждый триплет находится в некотором композиционном отношении ко всем другим триплетам.

Задача содержательного упорядочения всего множества из 64 триплетов положена в основу исследования С.В. Петухова [], трактующего систему элементов генетического кода как ансамбль двоичных подсистем. Им описан принцип, согласно которому все триплеты закономерно размещаются в матрицу (8 x 8), обладающую двойной периодичностью. При этом все кодоны естественным образом нумеруются числами от 0 до 63, исходя из биохимических признаков бинарного типа у азотистых оснований.



В основу Бипериодической Таблицы (БТ) положен принцип "дважды триграммного упорядочения" множества кодонов. Он состоит из двух частей: упорядочения, членящего множество 64 триплетов на октеты, и упорядочения кодонов внутри всех этих октетов. Оба эти принципа имеют глубокое биохимическое обоснование.

Первый принцип заключается в фиксации числа и очередности пуриновых и пиримидиновых оснований в триплетах. Например, рассмотрим подмножество триплетов, у которых первое основание является пиримидиновым (т.е. С или U), а второе и третье - пуриновыми (т.е. А или G). Легко проверить, что этому условию удовлетворяют следующие восемь (октет) триплетов: САА, САG, CGA, UAA, CGG, UAG, UGA, UGG. Если теперь каждое пиримидиновое основание обозначить через "1", а каждое пуриновое через "0", тогда каждому из указанных триплетов можно поставить в соответствие трехразрядное двоичное число 100, называемое "триграммным символом" (или просто "триграммой") данного октета.

В БТ каждому такому октету соответствует отдельный столбец, отмеченный своей индивидуальной "триграммой". Поскольку существует восемь различных "триграмм", каждой из которых соответствует одна из трехразрядных двоичных комбинаций (000, 001, 010, 011, 100, 101, 110, 111), то в БТ может быть выделено восемь октетов, пронумерованных (слева направо) двоичными числами от 111 до 000.

Важно отметить, что порядок следования столбцов в БТ (от 111 к 000) выбран таким образом, что октеты левой и правой половины БТ размещены зеркально-симметрично относительно ее средней линии так, что каждой триграмме левой половины (000, 001, 010, 011) соответствует "антисимметричная" триграмма (111, 110, 101, 100), занимающая зеркально-симметричную позицию в правой половине.

Теперь проанализируем БТ по столбцам. Нетрудно увидеть, что здесь реализуется принцип упорядочения четырех азотистых оснований на пару С и А (соответствуют двоичному символу "1") и пару G и U (соответствует двоичному символу "0"). Оказывается, что в таком членении имеется глубокий биохимический смысл с точки зрения свойства мутагенности, так как нуклеотиды С и А являются максимально изменяющимися под действием азотистой кислоты, а два других нуклеотида G и U являются неизменяющимися. Тогда трехразрядным двоичным кодом 111 (первая строка БТ) можно обозначить все 8 триплетов, составленные только из "изменяющихся" нуклеотидов: ССС, ССА, САС, САА, АСС, АСА, ААС, ААА.

Двигаясь вниз по столбцам БТ, мы будем получать триплеты, все менее чувствительные к действию азотистой кислоты. Действительно, трехразрядный двоичный код 110 (вторая строка БТ) будет соответствовать всем триплетам, в которых первые два нуклеотида соответствуют "изменяющимся" нуклеотидам (пара С и А), а последний нуклеотид соответствует паре А и G. Последняя строка БТ состоит из триплетов, соответствующих паре А и G ("неизменяющиеся" нуклеотиды) и ей соответствует двоичный трехразрядный код 000.

При таком способе кодирования триплетов каждый кодон может быть однозначно представлен 6-разрядным двоичным кодом, который соответствует некоторому десятичному числу. Каждый такой 6-разрядный код состоит из двух трехразрядных частей, причем левая часть соответствует коду строки, в которой находится триплет, а правая часть - триграмме столбца, в которой находится кодон. Например, запись 101 110 соответствует кодону CUA. Если теперь запись 101 110 рассматривать как десятичное число 46, то это означает, что кодон CUA в БТ имеет номер 46.

Анализ БТ генетического кода, проведенный С.В. Петуховым, привел к обнаружению новых удивительных системных свойств генетического кода и всем, кто хочет глубже познакомиться с проблемой, мы отсылаем к замечательной книге С.В. Петухова, которая открывает новые перспективы исследования проблемы генетического кодирования. Дополнительную информацию о ней можно найти на сайте http://members.tripod.com/vismath/sg/petoukhov.htm

Некоторые полезные аналогии между кодом Фибоначчи и генетическим кодом

Хотя "расшифровка" генетического кода была осуществлена еще в начале 60-х годов 20-го столетия, но исследования в этой области интенсивно продолжаются. Особенно важными можно считать такие приложения "генной инженерии" как создание "биокомпьютеров", основанных на ДНК. В этой связи весьма полезным является установление аналогий между генетическим кодом и способами кодирования, используемыми в современной информатики, в частности, с кодом Фибоначчи.

Для установления аналогии с генетическим кодом рассмотрим 6-разрядный код Фибоначчи, в котором весами разрядов являются числа Фибоначчи 1, 1, 2, 3, 5, 8.

N = a6  8 + a5  5 + a4  3 + a3  2 + a2  1 + a1  1.

(1)

Отметим следующие аналогии между шестиразрядным кодом Фибоначчи и триплетным кодированием наследственной информации:

  1. Первая аналогия. Шестиразрядный двоичный код Фибоначчи использует для представления чисел 26 = 64 двоичных кодовых комбинаций от 000000 до 111111, что совпадает с числом триплетов генетического кода 43 = 64.

  2. Вторая аналогия. С помощью 6-разрядного кода Фибоначчи можно закодировать 21 целое число, начиная с числа 0, которое изображается с помощью 6-разрядной двоичной комбинации: 00000, и заканчивая максимальным числом 20, которое изображается с помощью 6-разрядной кодовой комбинации 111111. Заметим, что, используя триплетное кодирование, в генетическом коде также представляется 21 объект, включая 20 аминокислот и один дополнительный объект в виде стоп-кодона (знак пунктуации), несущего в себе информацию об окончании белкового синтеза.

  3. Третья аналогия. Основной особенностью кода Фибоначчи является множественность представления чисел. За исключением минимального числа 0 и максимального числа 20, которые имеют в коде Фибоначчи единственные представления (соответственно 000000 и 111111), все остальные числа от 1 до 19 имеют в коде Фибоначчи множественное представление, то есть используют не меньше двух кодовых представлений. Следует отметить, что в генетическом коде также используется свойство множественности представления, которое называется "вырожденностью" генетического кодирования.

Таким образом, между 6-разрядным кодом Фибоначчи и генетическим кодом, основанном на триплетном представлении аминокислот, существуют весьма интересные аналогии, которые среди остальных способов избыточного кодирования выделяют код Фибоначчи в особый способ кодирования, изучение которого может способствовать раскрытию особенностей генетического кодирования. Можно высказать предположение, что подобные аналогии могут стать весьма полезными при решении проблемы создания био-компьютеров, основанных на ДНК.

Бипериодическая таблица кода Фибоначчи

Рассмотрим кодовую таблицу 6-разрядного кода Фибоначчи. В ней перечислены все двоичные комбинации от комбинации A0 = 000000 до комбинации A63 = 111111 и каждой кодовой комбинации (КК) поставлено в соответствие целое число N, соответствующее в коде Фибоначчи данной КК.

KK

8

5

3

2

1

1

N

CC

8

5

3

2

1

1

N

A0

0

0

0

0

0

0

0

A32

1

0

0

0

0

0

8

A1

0

0

0

0

0

1

1

A33

1

0

0

0

0

1

9

A2

0

0

0

0

1

0

1

A34

1

0

0

0

1

0

9

A3

0

0

0

0

1

1

2

A35

1

0

0

0

1

1

10

A4

0

0

0

1

0

0

2

A36

1

0

0

1

0

0

10

A5

0

0

0

1

0

1

3

A37

1

0

0

1

0

1

11

A6

0

0

0

1

1

0

3

A38

1

0

0

1

1

0

11

A7

0

0

0

1

1

1

4

A39

1

0

0

1

1

1

12

A8

0

0

1

0

0

0

3

A40

1

0

1

0

0

0

11

A9

0

0

1

0

0

1

4

A41

1

0

1

0

0

1

12

A10

0

0

1

0

1

0

4

A42

1

0

1

0

1

0

12

A11

0

0

1

0

1

1

5

A43

1

0

1

0

1

1

13

A12

0

0

1

1

0

0

5

A44

1

0

1

1

0

0

13

A13

0

0

1

1

0

1

6

A45

1

0

1

1

0

1

14

A14

0

0

1

1

1

0

6

A46

1

0

1

1

1

0

14

A15

0

0

1

1

1

1

7

A47

1

0

1

1

1

1

15

A16

0

1

0

0

0

0

5

A48

1

1

0

0

0

0

13

A17

0

1

0

0

0

1

6

A49

1

1

0

0

0

1

14

A18

0

1

0

0

1

0

6

A50

1

1

0

0

1

0

14

A19

0

1

0

0

1

1

7

A51

1

1

0

0

1

1

15

A20

0

1

0

1

0

0

7

A52

1

1

0

1

0

0

15

A21

0

1

0

1

0

1

8

A53

1

1

0

1

0

1

16

A22

0

1

0

1

1

0

8

A54

1

1

0

1

1

0

16

A23

0

1

0

1

1

1

9

A55

1

1

0

1

1

1

17

A24

0

1

1

0

0

0

8

A56

1

1

1

0

0

0

16

A25

0

1

1

0

0

1

9

A57

1

1

1

0

0

1

17

A26

0

1

1

0

1

0

9

A58

1

1

1

0

1

0

17

A27

0

1

1

0

1

1

10

A59

1

1

1

0

1

1

18

A28

0

1

1

1

0

0

10

A60

1

1

1

1

0

0

18

A29

0

1

1

1

0

1

11

A61

1

1

1

1

0

1

19

A30

0

1

1

1

1

0

11

A62

1

1

1

1

1

0

19

A31

0

1

1

1

1

1

12

A63

1

1

1

1

1

1

20

Если теперь выделить подмножества всех КК, соответствующих одному и тому же числу, то получим следующую картину.

N

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

KK

A0

A1
A2

A3
A4

A5
A6
A8

A7
A9
A10

A11
A12
A16

A13
A14
A17
A18

A15
A19
A20

A21
A22
A24
A32

A23
A25
A26
A33
A34

A27
A28
A35
A36

A29
A30
A37
A38
A40

A31
A39
A41
A42

A43
A44
A48

A45
A46
A49
A50

A47
A51
A52

A53
A54
A56

A55
A57
A58

A59
A60

A61
A62

A63

M

1

2

2

3

3

3

4

3

4

5

4

5

4

3

4

3

3

3

2

2

1

Эта таблица задает отображение всех целых чисел в диапазоне от 0 до 20 на множество всех 6-разрядных двоичных КК. Это отображение обладает строгой регулярностью. Каждому числу N в диапазоне 0-20 соответствует свое античисло N, которые связаны следующими соотношениями:

  1. N + N = 20 (например, 9 + 11 = 20);

  2. Число КК, изображающих число N, совпадает с числом КК, изображающих античисло N, причем каждой КК для числа N соответствует некоторая КК, изображающая античисло N, которая является "инверсией" исходной КК. Например, числу 9 соответствует античисло 11, причем КК A23 = 010111, изображающей число 9 = 5+2+1+1, соответствует КК A40 = 101000, которая является изображением числа 11=8+3 и может быть получено из КК A23 путем инвертирования ее двоичных разрядов. Заметим также, число 23, являющееся номером КК A23, связано с числом 40, являющимся номером КК A40, следующим соотношением 23+40=63 (это правило справедливо для всех КК такого типа).

  3. (3) Единственным исключением из указанного в пункте 2 правила является число 10, которое одновременно является и античислом (10+10=20); при этом каждой из четырех КК, изображающих число 10, соответствует КК, являющаяся "инверсией" исходной (например, КК A27 связана с КК A36 соотношением: 27+36=63, и КК A28 связана с КК A35 соотношением: 28+35=63).

Используя подход, изложенный в вышеупомянутой книге С. В. Петухова, можно построить бипериодическую таблицу (БТ) 6-разрядного кода Фибоначчи. БТ представляет собой квадратную таблицу размером 8 8. Каждой ячейке БТ соответствует некоторая 6-разрядная КК, состоящая из двух трехразрядных частей, младшей и старшей. Младшие части КК кодируют столбцы таблицы, а старшие - ее строки. Тогда КК находится в ячейке БТ, находящиеся на пересечении соответствующей строки и столбца, троичные коды которых образуют в совокупности код заданной 6-разрядной КК. Например, КК A51 = 110 011 находится в ячейке БТ, которая находится на пересечении строки, кодируемой как 110 и столбца, кодируемого как 011. Согласно приведенной выше кодовой таблице 6-разрядного кода Фибоначчи, каждой КК соответствует некоторое число в коде Фибоначчи. Например, КК A51 = 110 011 соответствует число 15. Тогда в соответствующую ячейку БТ мы должны записать КК вместе с соответствующим ей числом.




111

110

101

100

011

010

001

000



111

A63 = 20

A62 = 19

A61 = 19

A60 = 18

A59 = 18

A58 = 17

A57 = 17

A56 = 16

144 = 8 18

111

A63 = 20

A62 = 19

A61 = 19

A60 = 18

A59 = 18

A58 = 17

A57 = 17

A56 = 16

144 = 8 18

110

A55 = 17

A54 = 16

A53 = 16

A52 = 15

A51 = 15

A50 = 14

A49 = 14

A48 = 13

120 = 8 15

101

A47 = 15

A46 = 14

A45 = 14

A44 = 13

A43 = 13

A42 = 12

A41 = 12

A40 = 11

104 = 8 13

100

A39 = 12

A38 = 11

A37 = 11

A36 = 10

A35 = 10

A34 = 9

A33 = 9

A32 = 8

80 = 8 10

011

A31 = 12

A30 = 11

A29 = 11

A28 = 10

A27 = 10

A26 = 9

A25 = 9

A24 = 8

80 = 8 10

010

A23 = 9

A22 = 8

A21 = 8

A20 = 7

A19 = 7

A18 = 6

A17 = 6

A16 = 5

56 = 8 7

001

A15 = 7

A14 = 6

A13 = 6

A12 = 5

A11 = 5

A10 = 4

A9 = 4

A8 = 3

40 = 8 5

000

A7 = 4

A6 = 3

A5 = 3

A4 = 2

A3 = 2

A2 = 1

A1 = 1

A0 = 0

16 = 8 2




96 = 8 12

88 = 8 11

88 = 8 11

80 = 8 10

80 = 8 10

72 = 8 9

72 = 8 9

64 = 8 8

640

Ниже приведена эта же БТ кода Фибоначчи, в которой в ячейках таблицы оставлены только значения чисел, изображаемых КК.




111

110

101

100

011

010

001

000




111

20

19

19

18

18

17

17

16

144 = 8 18

111

20

19

19

18

18

17

17

16

144 = 8 18

110

17

16

16

15

15

14

14

13

120 = 8 15

101

15

14

14

13

13

12

12

11

104 = 8 13

100

12

11

11

10

10

9

9

8

80 = 8 10

011

12

11

11

10

10

9

9

8

80 = 8 10

010

9

8

8

7

7

6

6

5

56 = 8 7

001

7

6

6

5

5

4

4

3

40 = 8 5

000

4

3

3

2

2

1

1

0

16 = 8 2




96 = 8 12

88 = 8 11

88 = 8 11

80 = 8 10

80 = 8 10

72 = 8 9

72 = 8 9

64 = 8 8

640 = 8 80

В указанной таблице можно увидеть следующие закономерности:

  1. Сумма чисел по столбцам и по строкам всегда является числом, кратным 8. Напомним, что число 8 является характерным для сумм протонов в аминокислотах. В частности, имеется 12 аминокислот (см. стр. 125 книги С.В. Петухова), имеющих восьмеричное основание.

  2. Биопрериодическая таблица кода Фибоначчи обладает исключительной регулярностью. В ней наблюдается следующее свойство "зеркальной симметрии". Если разбить таблицу на две равные части по горизонтали или вертикали, то строки, находящиеся сверху и снизу от горизонтальной линии или справа и слева от вертикальной линии разбиения, состоят из одинаковых чисел (12, 11, 11, 10, 10, 9, 9, 8 - по горизонтали и 18, 15, 13, 10, 10, 7, 5, 2 - по вертикали). Любопытно, что число 10, которое является одновременно и античислом, находится в центре таблицы. Каждому числу в верхней части вертикального столбца "зеркально симметрично" соответствует число в нижней части того же вертикального столбца, такое, что в сумме эти числа дают постоянное число для каждого столбца (24 - для 1-го столбца, 22 для 2-го и 3-го столбцов, 20 - для 4-го и 5-го столбцов, 18 - для 6-го и 7-го столбцов, 16 - для 8-го столбца). Такая же закономерность наблюдается и для "зеркально-симметричных" чисел, расположенных в строках таблицы. Если считать первой строку сверху, то суммы "зеркально-симметричных" чисел по строкам дают следующие значения (36 - для 1-ой строки, 30 - для 2-й строки, 26 - для 3-й строки, 20 - для 4-й и 5-й строки, 14-для 6-й строки, 10- для 7-й строки, 4 - для 8-й строки). Заметим также, что суммы чисел, расположенных на диагоналях таблицы, равны 80 = 20 + 16 + 14 + 10 + 10 + 6 + 4 + 0 = 4 + 6 + 10 + 8 + 10 + 12 + 14 + 16.

  3. Заметим, что такое же свойство "зеркальной симметрии" наблюдается и в каждом из квадрантов таблицы. Действительно, для 1-го квадранта (левый вверху) справедливы следующие закономерности для сумм "зеркально-симметричных чисел (32, 30, 30, 28 - по столбцам, 38, 32, 28, 22 - по строкам); для 2-го (правый вверху) квадранта (38, 36, 36, 34 - по столбцам, 34, 28, 24, 18 - по строкам); для 3-го (левый снизу) квадранта (16, 14, 14, 12 - по столбцам, 22, 16, 12, 6 - по строкам); для 4-го (правый снизу) квадранта (12,10, 10, 8 - по столбцам, 18, 12, 8, 2 - по строкам). Заметим также, что сумма чисел, расположенных на диагоналях 1-го квадранта, равна 60 = 20 + 16 + 14 + 10 = 12 + 14 + 16 + 18; для 2-го квадранта - 52 = 18 + 14 + 12 + 8 = 10 + 12 + 14 + 16; для 3-го квадранта - 28 = 12 + 8 + 6 + 2 = 4 + 6 + 10 + 8; для 4-го квадранта - 20 = 10 + 6 + 4 + 0 = 2 + 4 + 6 + 8.

  4. (4) Если теперь каждый из квадрантов разбить на 4 новых квадранта размером 2 2, то в них наблюдается та же регулярность (все диагональные суммы равны между собой).

  1   2   3   4   5

Похожие:

Исходные данные о генетическом коде iconИсходные данные к курсовым работам по дисциплине «Теплотехника» для разных типов тепообменных аппаратов
Исходные данные к курсовой работе №1 тепловой расчет пароводяного подогревателя горизонтального типа
Исходные данные о генетическом коде iconЗадача 1 Исходные данные
Исходные данные: студенты некоторой группы, состоящей из 30 человек сдали экзамен по курсу «Информатика». Полученные студентами оценки...
Исходные данные о генетическом коде iconПрактикум Абакан 2011 Содержание: Тема Стратегия создания нового продукта. Исходные данные 3 Темы для обсуждения 7
Тема Стратегия репозиционирования: качество как опцион. Исходные данные
Исходные данные о генетическом коде iconСетевая игра “Морской бой” Требования и исходные данные
Содержит требования, предъявляемые к компоненту “Сетевая игра “Морской бой” и исходные данные, необходимые для реализации указанных...
Исходные данные о генетическом коде iconИсходные данные Показатели

Исходные данные о генетическом коде iconПриложение Исходные данные для выполнения задания 3

Исходные данные о генетическом коде iconПриложение Исходные данные для выполнения задания 3

Исходные данные о генетическом коде iconОтчет по первому этапу, дающий необходимые исходные данные для проектирования

Исходные данные о генетическом коде iconГлава Становление космологии и космогонии
Исходные данные для рассмотрения космических явлений
Исходные данные о генетическом коде iconСостав проекта 2 1 Основания и исходные данные для проектирования 4
Основные природоохранные рекомендации при реконструкции причального сооружения 37
Разместите кнопку на своём сайте:
ru.convdocs.org


База данных защищена авторским правом ©ru.convdocs.org 2016
обратиться к администрации
ru.convdocs.org