ENCODE PROJET
Le projet Encode (Encyclopedia of DNA elements) a été lancé en 2003. Son but était de rechercher tous les éléments fonctionnels présents dans l'ADN du génome humain. La première synthèse de ce travail gigantesque, qui a impliqué plusieurs dizaines de laboratoires et quelques centaines de chercheurs, a été publiée dans la revue Nature (qui héberge le site Web du projet) le 5 septembre 2012. La conclusion principale est que, contrairement à ce que l'on pensait auparavant, les gènes ne sont pas noyés dans un océan d'ADN non codant : l'ADN non codant n'existe pratiquement plus, on peut lui associer désormais de nombreuses fonctions génétiques jusqu'ici seulement entrevues.
Le projet Encode est la suite du programme Génome humain lancé en 1989. Le but de ce dernier était de déterminer la séquence complète de l'ADN du génome humain, terminée en avril 2003, publiée en 2004. À partir de là, l'exploitation de cette séquence à 3 milliards de dollars à l'époque (moins de 1 000 désormais) s'est orientée dans plusieurs directions facilitées par l'effondrement des coûts de séquençage et la mise en place de puissants logiciels d'analyse des séquences d'ADN. Une de ces directions a été de définir tous les éléments fonctionnels codés par le génome humain. La recherche des gènes, publiée en 2004 avait déjà conclu à l'existence de 30 000 gènes, donc de séquences dites codantes, chez l'homme, avec une localisation précise sur chaque chromosome.
Les gènes sont constitués chacun d'une séquence définie de bases nucléiques le long de la molécule d'ADN de chaque chromosome. Ils ont longtemps été définis par leur capacité à coder chacun pour une protéine ou pour un ARN qui en est la copie (ARN messager, ribosomique, etc.). Dans l'ADN d'une bactérie aucun espace n'est perdu, tout l'ADN code pour quelque chose et est donc une succession de gènes et de séquences qui en contrôlent l'expression. Concernant l'ADN des organismes supérieurs, une première surprise avait été la découverte vers 1980 que de l'ADN non codant était localisé à l'intérieur même de nombreux gènes, et que les gènes eux-mêmes étaient séparés les uns des autres par de longues séquences d'un ADN baptisé non codant, parce qu'on ne lui connaissait aucun rôle. Certes, quelques fonctions lui étaient associées, comme le contrôle de l'activité des gènes, mais, l'un dans l'autre, on admettait que, chez l'homme, l'ADN codant et l'ADN régulateur cumulés ne devaient pas occuper plus de 10 p. 100 de l'ADN total. La conclusion était confirmée en 2004 à partir de la séquence de l'ADN chromosomique humain complet.

Projet Encode
D. Leja/ NHGRI ; I. Dunham/ EBI ; traduction : Encyclopædia Universalis France
Projet Encode
Les nombreux scientifiques impliqués dans le projet Encode ont utilisé plusieurs méthodes pour…
D. Leja/ NHGRI ; I. Dunham/ EBI ; traduction : Encyclopædia Universalis France
Mais notre compréhension de l'organisation du génome était loin d'être parfaite. En effet, tout dépend de la définition que l'on donne des fonctions de l'ADN. Si l'on s'écarte de la définition classique du gène, on définit un élément fonctionnel comme une séquence d'ADN qui, bien entendu peut coder pour une protéine ou un ARN, mais qui peut aussi présenter une signature caractéristique d'une autre fonction biologique : par exemple un site de fixation d'une protéine régulatrice ou d'une protéine de structure, un repli particulier de la molécule d'ADN ou du chromosome, un site de modification chimique de l'ADN, si importante en épigénétique, points de contact entre chromosomes, etc. Encode ne s'est ainsi pas donné pour mission d'identifier les seuls gènes, mais tous les éléments fonctionnels de l'ADN. Pour ce faire, Encode utilise le répertoire actuel de ces signatures et ajoute les séquences en ADN des produits d'expression d'un grand nombre de types cellulaires différents (ce qui comprend ARN non codant, produits[...]
La suite de cet article est accessible aux abonnés
- Des contenus variés, complets et fiables
- Accessible sur tous les écrans
- Pas de publicité
Déjà abonné ? Se connecter
Écrit par
- Gabriel GACHELIN : chercheur en histoire des sciences, université Paris-VII-Denis-Diderot, ancien chef de service à l'Institut Pasteur
Classification
Pour citer cet article
Gabriel GACHELIN, « ENCODE PROJET », Encyclopædia Universalis [en ligne], consulté le . URL :
Média
Voir aussi
- GÉNOME HUMAIN
- SÉQUENÇAGE, génétique moléculaire
- BIOLOGIE MOLÉCULAIRE
- BIO-INFORMATIQUE
- RÉGULATION GÉNÉTIQUE
- INFORMATIQUE, biologie et médecine
- NUCLÉOTIDIQUE SÉQUENCE
- GÉNÉTIQUE MOLÉCULAIRE
- MOLÉCULES BIOLOGIQUES, structure et fonction
- PRÉDISPOSITION GÉNÉTIQUE ou SUSCEPTIBILITÉ GÉNÉTIQUE AUX MALADIES
- PHYLOGÉNIE MOLÉCULAIRE