INFORMATION GÉNÉTIQUE

Carte mentale

Élargissez votre recherche dans Universalis

Codage génétique et biosynthèse des protéines

Les caractères héréditaires « visibles », mais aussi toutes les propriétés d'un organisme sont déterminés, au niveau de la biochimie cellulaire, par des réseaux de réactions physico-chimiques, dont chacune est catalysée par une enzyme spécifique. Telle ou telle réaction est« branchée » ou « débranchée » suivant que l'enzyme responsable est ou non présente sous une forme active.

Les enzymes sont des protéines dont la structure moléculaire très précise détermine l'activité catalytique et la spécificité. Or, la synthèse par une cellule d'une enzyme donnée est sous la dépendance d'un des gènes de cette cellule. La synthèse des protéines enzymatiques est donc le mécanisme par lequel les gènes déterminent le fonctionnement cellulaire à travers telle ou telle réaction du métabolisme. Les protéines sont des polymères d'acides aminés assemblés l'un à la suite de l'autre en longues chaînes, telles que la structure spécifique de la molécule protéique (et son activité enzymatique) dépendent de façon critique de la nature des acides aminés et de l'ordre dans lequel ils se succèdent. Or il n'existe dans la nature qu'une vingtaine d'acides aminés. La spécificité d'une chaîne protéique donnée ne dépend donc que de celle de la séquence des acides aminés qui la constituent, tout comme la spécificité d'une phrase écrite à l'aide d'un alphabet comportant vingt lettres ne dépend que de la séquence des lettres et signes (y compris les blancs de séparation entre les mots) qui constituent la phrase. La synthèse d'une protéine donnée implique donc une machinerie par laquelle les acides aminés sont assemblés en une séquence bien déterminée, tout comme l'écriture d'une phrase implique une séquence de lettres et pas une autre.

Puisqu'il s'agit de caractères héréditaires, l'origine de cette détermination ne peut se trouver que dans les gènes. C'est la structure d'un gène qui, dans la synthèse d'une enzyme donnée, est responsable de la séquence spécifique d'acides aminés qui caractérise cette enzyme. Le mécanisme, maintenant bien connu, par lequel s'effectue cette détermination réalise une voie de transmission d'information au sens formel le plus strict de la théorie de l'information de Shannon. En effet, la structure moléculaire des gènes est celle des ADN et il existe une correspondance entre cette structure et celle des protéines. Les ADN sont, eux aussi, des polymères, longues chaînes dont les éléments sont cette fois non plus des acides aminés mais des molécules un peu plus compliquées, dites nucléotides. Or il n'existe dans la nature que quatre sortes de nucléotides constituant les ADN. Une molécule d'ADN ne diffère d'une autre – donc un gène ne diffère d'un autre – que par l'ordre dans lequel sont assemblés les nucléotides (parfois plusieurs milliers) dans la séquence qui la constitue. Si une molécule protéique peut être comparée à une phrase écrite à l'aide d'un alphabet comportant vingt lettres, une molécule d'ADN constituant un gène est semblable à une phrase écrite à l'aide d'un alphabet comportant quatre lettres. La synthèse d'une séquence protéique donnée, déterminée par un gène, équivaut donc, sur le plan formel, à la traduction d'une séquence de nucléotides en une séquence d'acides aminés, soit à la traduction d'une phrase écrite à l'aide d'un alphabet de quatre lettres en une phrase écrite dans un alphabet de vingt lettres. Formellement, les problèmes posés par cette traduction sont ceux d'une voie de communication dans la théorie de l'information de Shannon, voie caractérisée par un message d'entrée (la séquence nucléotidique de l'ADN) et un message de sortie (la séquence d'acides aminés de la protéine). Messages d'entrée et messages de sortie sont porteurs d'une certaine information que la voie de communication est capable de transmettre.

La théorie de l'information de Shannon est une théorie formelle de telles communications, indépendante du substrat physique et des mécanismes par lesquels la transmission est effectuée. C'est pourquoi, tout naturellement, elle a pu être appliquée ici, contribuant ainsi à la définition de l'information génétique, alors même qu'elle avait été construite pour traiter de problèmes de télécommunications et d'analyse du langage. Rappelons pourtant que suivant Shannon, la quantité d'information d'un message n'est définie que par les probabilités d'utilisation des lettres dans ce message et dans d'autres appartenant à une même classe utilisant l'alphabet de la même façon. Cette définition purement probabiliste ne prend en compte que la succession des lettres, à l'exclusion de la signification éventuelle du message. Aussi, dans la voie de communication que nous avons décrite, ne peut-on parler de transmission d'information que dans ce sens restreint où des séquences de « lettres » (nucléotides ou acides aminés) sont reproduites, la question de leur signification étant totalement mise entre parenthèses.

Au sens de cette théorie, la transmission d'information avec conservation de la quantité d'information contenue dans un message revient à une application du message d'entrée sur le message de sortie. Application au sens mathématique du terme, c'est-à-dire correspondance entre les éléments d'un ensemble E et ceux d'un ensemble F, telle que, pour tout élément de E, il existe un et un seul élément de F qui lui corresponde. Dans le cas qui nous occupe ici où des alphabets différents sont utilisés, cette application doit comporter en outre des opérations de codage et de décodage par lesquelles une correspondance est établie entre combinaisons de lettres des deux alphabets. Ces notions ont abouti non seulement à la définition de l'information génétique, mais encore au déchiffrement du code génétique et à la découverte de son universalité, découverte probablement la plus bouleversante dans cet ensemble que constitue la biologie moléculaire. À chacun des vingt acides aminés correspond un triplet de trois parmi les quatre nucléotides, dans un certain ordre. Il existe 43, soit 64 façons de réaliser de tels triplets, dits codons. En général plusieurs triplets différents codent pour le même acide aminé : on dit que le code est dégénéré. Mais ce code est le même chez tous les organismes étudiés : il est universel.

Par ailleurs, la séquence polynucléotidique des ADN est elle-même le message de sortie d'une autre voie de communication par laquelle un ADN parental a été en quelque sorte « recopié » lors des mécanismes de la reproduction cellulaire lorsque les chromosomes, avec leurs gènes, sont dupliqués. Ainsi, le message d'entrée de la synthèse protéique est aussi message de sortie de la réplication des ADN : c'est lui qui véhicule chez l'individu l'information génétique en provenance de l'espèce et en l [...]

1  2  3  4  5
pour nos abonnés,
l’article se compose de 10 pages

Écrit par :

  • : professeur émérite de biophysique aux universités de Paris-VI-Pierre-et-Marie-Curie et de Jérusalem, directeur d'études à l'École des hautes études en sciences sociales, Paris, directeur du Centre de recherches en biologie humaine, hôpital Hadassah, Jérusalem (Israël)

Classification

Autres références

«  INFORMATION GÉNÉTIQUE  » est également traité dans :

ADN ET INFORMATION GÉNÉTIQUE

  • Écrit par 
  • Nicolas CHEVASSUS-au-LOUIS
  •  • 238 mots

Jusqu'en 1944, on ignorait quelle pouvait être la nature chimique de la molécule présente dans les chromosomes et porteuse de l'information génétique. Alors que la plupart des chercheurs pensaient qu'il s'agissait de protéines, deux publications viennent montrer, en 1944, qu'il s'agit de l'ADN, l'acide désoxyribonucléiqu […] Lire la suite

ADN (acide désoxyribonucléique) ou DNA (deoxyribonucleic acid)

  • Écrit par 
  • Michel DUGUET, 
  • David MONCHAUD, 
  • Michel MORANGE
  • , Universalis
  •  • 10 070 mots
  •  • 10 médias

Dans le chapitre « L'ADN, source d'information génétique »  : […] Une fois connue la structure du matériel génétique, il fallait comprendre comment celui-ci pouvait contrôler la synthèse des protéines, molécules responsables des fonctions élémentaires de la cellule, et en particulier des fonctions de catalyse enzymatique. Dès 1940, les Américains George Beadle et Edward Tatum avaient démontré l'existence d'une relation précise, soupçonnée dès le début du xx e […] Lire la suite

BIOCHIMIE

  • Écrit par 
  • Pierre KAMOUN
  •  • 3 874 mots
  •  • 5 médias

Dans le chapitre « Biologie moléculaire »  : […] La biologie moléculaire est, parmi toutes les branches de la biochimie, celle dont l'expansion est actuellement la plus rapide. Elle s'identifie à l'ensemble des réactions qui permettent l'expression et la transmission du message génétique. C'est donc la biochimie de l' ADN, qui est le vecteur de l'information génétique. L'ADN est connu depuis 1869, mais ce n'est qu'en 1944 qu'Avery, Mac Leod et […] Lire la suite

BIOLOGIE - La bio-informatique

  • Écrit par 
  • Bernard CAUDRON
  •  • 5 440 mots
  •  • 3 médias

Dans le chapitre « Définition et enjeux de la discipline »  : […] La bio-informatique est une discipline émergente de la recherche qui se place à l'interface de la biologie et de l'informatique. Il y a différentes façons de la définir. Il est possible de classer les bio-informaticiens qui la pratiquent en trois groupes (Victor Jongeneel, 2000). Les premiers se définissent comme pratiquant une branche fondamentale de la biologie capable de prédire, par des moyens […] Lire la suite

BIOTECHNOLOGIES

  • Écrit par 
  • Pierre TAMBOURIN
  •  • 5 348 mots
  •  • 4 médias

Dans le chapitre « L'essor des biotechnologies »  : […] Trois bouleversements sont à l'origine de l'essor des biotechnologies modernes : le développement d'outils moléculaires très performants ; l'explosion des connaissances dans le domaine de la génétique ; et, enfin, l'accumulation de données biologiques issues des vastes programmes internationaux de séquençage des génomes (génomique) . Les outils moléculaires du génie génétique (enzymes de restric […] Lire la suite

CARACTÈRES, biologie

  • Écrit par 
  • Didier LAVERGNE
  •  • 950 mots
  •  • 1 média

En systématique, on utilise le terme « caractère » dans le sens de « caractéristique », en vue de la classification des êtres vivants, pour permettre une recension de leurs particularités. Celles-ci peuvent être qualitatives (couleur des cheveux ou du plumage) ou quantitatives (dimensions du corps et de ses diverses parties). On reconnaît des particularités morphologiques (absence ou présence d […] Lire la suite

CELLULE - L'organisation

  • Écrit par 
  • Pierre FAVARD
  •  • 11 012 mots
  •  • 10 médias

Dans le chapitre «  L'information génétique »  : […] Toutes les structures et toutes les activités des cellules sont définies par un programme qui correspond à des informations portées par les molécules d' ADN double brin : molécules d'ADN des chromosomes, plasmides, ADNmt, ADNct. Les unités d'information sont les gènes, segments d'ADN dont la séquence des désoxyribonucléotides code pour une molécule d'ARN qui va permettre la biosynthèse des prot […] Lire la suite

CELLULE - La division

  • Écrit par 
  • Marguerite PICARD
  •  • 4 985 mots
  •  • 4 médias

Dans le chapitre « La réplication de l'ADN »  : […] La réplication de l'ADN chez les eucaryotes suit les mêmes mécanismes de base que ceux qui sont décrits chez les bactéries. Cette réplication est en particulier semi-conservative et bidirectionnelle. Le problème de la duplication des chromosomes d'eucaryotes est cependant compliqué par la structure de la chromatine et par la quantité d'ADN à répliquer qui est de plusieurs centaines de fois supéri […] Lire la suite

DÉCRYPTAGE DU CODE GÉNÉTIQUE

  • Écrit par 
  • Nicolas CHEVASSUS-au-LOUIS
  •  • 223 mots
  •  • 1 média

Au début des années 1960, l'Américain Marshall W. Nirenberg découvre que l'addition d'un acide ribonucléique messager (ARNm) constitué uniquement d'uridine (U, un des quatre nucléotides) à un extrait bactérien suffit à déclencher la synthèse d'une protéine composée uniquement de phénylalanine. Tout se passe donc comme si la suite de trois nucléotides (appelée codon) UUU codait pour la phénylalani […] Lire la suite

DÉVELOPPEMENT (biologie) - Le développement animal

  • Écrit par 
  • Marc-Yves FISZMAN, 
  • Thomas HEAMS, 
  • Lieba LAZARD, 
  • Andras PALDI, 
  • Alain PRIVAT, 
  • Patricia SIMPSON
  •  • 16 177 mots
  •  • 10 médias

Dans le chapitre « Fonctions des gènes homéotiques »  : […] L' identité de chaque segment de l'animal est contrôlée par une série de gènes appelés gènes homéotiques. Ces gènes ont été découverts par E. Lewis, qui a commencé l'étude des mutants dans les années 1950. Le mot homéotique signifie « substitution d'une partie du corps par une autre normalement située ailleurs ». Ainsi, un mutant homéotique entraîne une transformation d'une partie du corps vers d […] Lire la suite

Voir aussi

Pour citer l’article

Henri ATLAN, « INFORMATION GÉNÉTIQUE », Encyclopædia Universalis [en ligne], consulté le 29 novembre 2021. URL : https://www.universalis.fr/encyclopedie/information-genetique/