News - 01.03.2021

La Saga du Génome Humain a 20 ans

La Saga du Génome Humain a 20 ans

Par  Fredj Tekaia et Abdellatif Boudabous - Depuis les publications les premières versions du génome humain, le développement de la génomique humaine a fait des avancées extraordinaires dans la connaissance de l’origine et la caractérisation des maladies génétiques ainsi que dans l’identification des gènes, des mutations et des variations génomiques qui contribuent au développement des maladies complexes (cardiaques, neurologiques, cancers, diabètes,...). De grands projets emblématiques de séquençage pour l’étude de ces nombreuses maladies ont permis d’établir des catalogues de variations génétiques et leurs éventuelles conséquences phénotypiques et cliniques à partir des génomes de populations de descendance essentiellement Européenne. Ces études ont néanmoins pointé la nécessité de couvrir toute la diversité génétique humaine, afin d’établir des catalogues universels.

Un autre développement spectaculaire concerne les génomes humains anciens obtenus à partir d’échantillons archéologiques (cheveux, fragment d’os,..) qui ont ouvert une ère nouvelle de la lecture de l’évolution de l’homme et de l’histoire de la migration d’Homo sapiens à partir de l’Afrique il y a environ 70000 ans, pour peupler le monde, s’adapter et se mélanger avec les populations locales en particulier avec le Neandertal (en Europe) et le Dénisovien (en Sibérie). Des legs génétiques du Neandertal et du Dénisovien, conséquences de ces mélanges, impactent encore aujourd’hui la biologie de certaines populations par des répercussions favorables ou défavorables sur leur santé et leur mode de vie.

Pour conclure, nous proposons d’intégrer ces avancées technologiques et scientifiques dans l’Enseignement et la Recherche Scientifique en Tunisie. Nous faisons nôtre la devise d’un programme stratégique canadien d’intégration des connaissances génomiques dans la santé de précision :
«Think Big, Start Small, And Learn Fast».
Notez que nous avons tenu à inclure un nombre important de références bibliographiques afin de permettre au lecteur intéressé d’approfondir les riches informations que nous rapportons.

Il y a 20 ans (15 Février 2001), les deux premières versions des séquences du génome humain ont été simultanément publiées par les journaux Nature, pour le projet public[1] et Science, pour le projet privé de Celera Genomics[2], aboutissement d’un programme lancé en 1990. Les deux versions du génome ont été séparément générées à partir de donneurs volontaires anonymes de différentes origines ethniques.

Ces deux journaux consacrent des articles[3,4] à cette épopée pour célébrer les avancées extraordinaires initiées par le séquençage du génome humain.

Dans la version du Consortium international, il était indiqué que la séquence produite correspondait environ à 94% du génome total et incluait de 30000 à 40000 gènes codants pour des protéines. La version Celera correspondait à environ 95% (2.91Gb) du génome total et incluait 39114 gènes codants pour des protéines. Ce nombre de gènes, environ le double de ce qu’on avait trouvé dans le génome du verre de terre Caenorhabditis élégants déjà séquencé en 1998, avait alors surpris plus d’un scientifique qui pensait que la complexité de la machinerie de l’homme nécessitait un nombre beaucoup plus grand que celui du petit verre de terre.

Après ces deux premières versions, il était évident qu’il fallait construire un génome humain de référence[5] aussi complet que possible, ce qui fut fait en 2004 mais avec 300 trous (Gaps ou fragments incomplets, non séquencés). Ce génome de référence est depuis continuellement complété et mis à jour avec de nouvelles données. La version actuelle du génome de référence humain GRCh38.p13 est composée de 3.27 Giga bases (Gb) et 19116 gènes codants pour des protéines. Ce qui est remarquable, c’est que le nombre de gènes a vertigineusement chuté par rapport aux premières estimations et les indications des deux premières publications. Le nombre exact des gènes du génome humain n’est d’ailleurs toujours pas connu à ce jour. On sait aujourd’hui que selon l’épissage des exons, plusieurs gènes codent pour plusieurs protéines à la fois et contrôlent plusieurs fonctions, ce qui réduit le nombre final de gènes humains et en plus rend difficile son établissement.  

La séquence du génome humain a marqué la recherche scientifique en ouvrant une ère nouvelle de séquençage touchant tous les organismes vivants ou éteints. Ces publications sont le début d’une ère génomique qui a transformé le paysage de la biologie, de la médecine et de l’histoire de l’évolution de l’homme. Ces développements ont été facilités par les avancées technologiques et la chute du coût de séquençage[6] ainsi que par les avancées extraordinaires de la Bioinformatique qui offrent de nouvelles méthodes et des outils permettant d’analyser les données et de répondre aux questions de plus en plus pointues posées par l’accumulation de masses des données génomiques[7] relatives à différents organismes.

Nous nous limitons ici à commenter les avancées concernant l’homme, uniquement sur le plan de la santé et de son évolution depuis le départ d’Homo sapiens de l’Afrique.

Télécharger le document intégral

Fredj Tekaia et Abdellatif Boudabous

Références

Note: des définitions de termes utilisés peuvent être trouvées dans ces 2 sites:

http://www.ensembl.org/info/website/glossary.html

http://www.ensembl.org/info/genome/variation/prediction/classification.html

1. International Human Genome Sequencing Consortium, et al. (2001). Initial sequencing and analysis of the human genome. Nature 409, 860–921. https://doi.org/10.1038/35057062

2. Venter JC. et al. (2001). The Sequence of the Human Genome.
Science; 291 (5507), 1304-1351. https://doi.org/10.1126/science.1058040

3. The Human Genome at 20: https://www.nature.com/collections/febigehfbg

4. Complicated legacies: The human genome at 20: https://science.sciencemag.org/content/371/6529/564

5. International Human Genome Sequencing Consortium. (2004). Finishing the euchromatic sequence of the human genome. Nature 431, 931–945.

6. Wetterstrand KA. DNA Sequencing Costs: Data from the NHGRI Genome Sequencing Program (GSP) Available at: www.genome.gov/sequencingcostsdata. Accessed [Frebruary, 2021].

7. Genome OnLine Database : https://gold.jgi.doe.gov