Anda di halaman 1dari 21

Gntique

La gnomique: les outils utiliss en biologie molculaire


Sommaire
Introduction" I. Les outils utiliss en biologie molculaire"
I.A. Les enzymes de restrictions! I.B. Le clonage et la construction de banque! I.C. Les techniques dhybridation! I.D. Lamplication enzymatique (PCR)! I.E. Le squenage!
I.E.1. Mthode de Maxam et Gilbert I.E.2. Mthode de Sanger

2 3
3 3 5 6 6
6 7

II. Les espces analyses"


II.A. Saccharomyces cerevisiae! II.B. Arabidopsis thaliana! II.C. Caenorhabditis elegans! II.D. Drosophila melanogaster! II.E. Mus musculus!

8
8 9 9 9 9

III. Les cartes de liaison"


III.A. Les cartes gntiques!
III.A.1. Les marqueurs RFLP III.A.2. Les microsatellites III.A.3. Obtention des cartes gntiques humaines III.1.4. Les cartes d'hybrides d'irradiation

9
10
10 11 11 12

III.B. Le squenage! III.C. Les cartes physiques!


III.C.1. Les cartes locales ou de petits gnomes III.C.2. Les cartes locales chez l'Homme

13 14
14 14

III.D. La cartographie physique du gnome humain! III.E. Identication d'un gne responsable d'une maladie monognique!

16 19

IV. Analyse des gnomes"


1 sur 21

20

Gntique

Introduction
Dnition: tude globale du gnome dans une condition particulire Dnition du gnome : lensemble du matriel gntique (gnes contenus dans les chromosomes au sein du noyau) dun organisme La gnomique consiste en ltude de lensemble des gnes La gnomique consiste dresser linventaire de lensemble des gnes dun organisme pour en tudier leur fonction. La gnomique se compose de 2 volets complmentaires: - La gnomique structurale dcrit lorganisation du gnome, ralise son squenage et dresse linventaire des gnes - La gnomique fonctionnelle tudie la fonction des gnes, leur mode de rgulation et leurs interactions La gnomique structurale : Elle sest dveloppe grce au progrs de la biologie molculaire, en particulier le squenage haut dbit et lanalyse de lexpression des gnes. Depuis la n des annes 80, le squenage des gnomes complets sest considrablement dvelopp Juillet 1984: premier gnome squenc EBV Juillet 1995 : premier gnome de procaryote squenc Haemophilis inuenza Octobre 1996 : premier gnome eucaryote squenc Saccharomyces cerevisiae Septembre 1997: E.Coli Dcembre 1998 : premier gnome deucaryotes pluricellulaires (mtazoaire) squencs Caenorhabilis elegans Mars 2000: Drosophilia Megalonaster Dcembre 2000: premier gnome de plante squenc Arabidopsis Thaliana Fvrier 2001: premire carte du gnome humain

La volont de squencer le gnome humain sest heurte des problmes techniques dus la complexit du gnome et la ncessit de squencer au pralable des organismes modle

2 sur 21

Gntique

I. Les outils utiliss en biologie molculaire


" " " " I.A. Les enzymes de restrictions

Ils sont capables de reconnaitre spciquement une squence de 4 10pb, et de cliver lADN au site reconnu plus loin. Ils permettent de fragmenter lADN et permettent le clonage. Plusieurs centaines denzymes de restriction ont t identis Ces outils permettent dtablir des cartes de restriction de toute molcule dADN, en couplant la digestion avec une lectrophorse permettant de calculer la taille des fragments gnrs

"

"

I.B. Le clonage et la construction de banque

De grandes molcules dADN (chromosomes) ne sont pas directement travaillables. Il faut les cloner pour pouvoir les manipuler. Le clonage consiste en linsertion dun fragment dADN dans un vecteur, ce vecteur tant propag dans une cellule hte (le plus souvent un procaryote). La culture de ces cellules et la purication de ce vecteur permettent de produire de grandes quantits du
Plusieurs sens du mot clonage: - Dolly - Insertion dun vecteur - Attribution un phnotype dun gne

fragment dADN clon. Les vecteurs de clonage bactrien sont les plasmides, les phages ou les cosmides qui permettent linsertion, respectivement, de 10, 20 et 45 kbp. Les BAC (bacterial articial chromosomes) permettent des insertions de 100 300 kpb

3 sur 21

Gntique

Le clonage concerne un fragment dADN unique (puri ou obtenu par PCR) pour une population dADN: on parle alors de banque. Le gros problme de ce type de construction est la reprsentativit de la banque. On peut construire des banques dADN gnomique comprenant lensemble du gnome, ou une banque dADN complmentaire (ADNc)
4 sur 21

Gntique

reprsentant lensemble des ADN messagers dun tissu choisi, pralablement recopis en ADN

"

"

I.C. Les techniques dhybridation

Elles permettent de dtecter une squence donne parmi une population de squence, laide dune sonde, fragment dADN (dans certains cas dARN), dont la squence est complmentaire de celle recherche. La sonde est marque par incorporation de nuclotides radioactifs, uorescents ou facilement dtectables. Le Southern-blot permet
5 sur 21

Gntique

de dtecter de lADN, le Nothern-blot de lARN. La sensibilit de la mthode permet de dtecter un ARN messager reprsent une fois sur 10000

"

"

I.D. Lamplication enzymatique (PCR)

La technique de PCR consiste amplier un fragment dADN encadr par 2 squences connues. Elle ncessite une polymrase thermostable et des oligonuclotides servant de primers. Un enchainement de cycles successifs de dnaturation de lADN cible, hybridation des amorces et polymrisation dune molcule dADN identique celle situe entre les amorces Les applications sont nombreuses: Mutagense dirige Production dun fragment dADN en grande quantit Prsence ou pas dun transcrit (RT-PCR) tudes transcriptomiques Criblage de banque

"

"

I.E. Le squenage

La dcouverte des techniques de squenage de lADN a permis de raliser le squenage de gnome entier. Un certain nombre dorganismes modles ont t ainsi compltement squencs Historiquement, on distingue 2 mthodes de squenage: - Le squenage selon Maxam et Gilbert - La mthode de Sanger ! ! ! ! I.E.1. Mthode de Maxam et Gilbert

Cette mthode a t dveloppe au dbut des annes 70 Le principe de la mthode repose sur: - Le marquage radioactif du brin dADN squencer (permets une identication par autoradiographie) Des coupures spciques, mais incompltes La sparation des fragments par lectrophorse (PAGE)

6 sur 21

Gntique

I.E.2. Mthode de Sanger

Cette mthode ncessite des didsoxynuclotides (qui ne possdent pas un CH ncessaire la liaison avec un dNTP en 3) On place un brin dADN avec une amorce, les 4 DNTP et un des 4 ddNTP en quantit telle que lADN polymrase ait le choix chaque fois entre choisir un DNTP ou le ddNTP

7 sur 21

Gntique

On obtient ces diffrentes situations, car chaque fois que lADN polymrase doit incorporer un A, elle peut soit incorporer un dATP et la rplication continue ou un ddATP, alors la rplication sarrte On ralise la mme exprience avec des ddCTP, ddGTP et ddTTP et on fait migrer le tout par lectrophorse comme pour la mthode de Maxam et Gilbert

II. Les espces analyses


Les espces analyses par ces mthodes sont surtout des procaryotes tels E. Coli, Streptococcus, car leur gnome est de petite taille et ils possdent un chromosome unique ce qui favorise le squenage. Cependant certains procaryotes possdent plusieurs chromosomes comme Bacillus cereus, Rhodobacter sphaeroides, Vibrio cholerae De nombreux eucaryotes sont ce jour squencs : Saccharomyces cerevisiae, Caenorhabditis elegans, Drosophila melanogaster, Mus musculus (souris), Arabidopsis thaliana et lHomme Lutilisation dorganismes modles est justie par lunicit structurale et fonctionnelle du vivant et par la faible taille des gnomes de ces espces

II.A. Saccharomyces cerevisiae

S. cerevisiae est un champignon unicellulaire pouvant se maintenir un tat haplode ou diplode et pouvant vivre avec ou sans mitochondrie. Cet organisme est utilis en gntique, biologie molculaire et cellulaire. Cest le premier organisme eucaryote dont le
8 sur 21

Gntique

gnome a t squenc, car il y avait des cartes gntiques assez compltes au pralable

II.B. Arabidopsis thaliana

A. thaliana est un crucifre servant de modle pour les vgtaux suprieurs, car cest langiosperme dont le gnome est le plus petit (120Mb) et sa gntique est simple

II.C. Caenorhabditis elegans

C. elegans est le premier animal pluricellulaire squenc. Il est utilis en embryologie et en neurobiologie, car ces animaux sont transparents ce qui permet de suivre chaque cellule individuellement. Ladulte possde 959 cellules dont on connat prcisment le devenir au cours du dveloppement. Il y a 352 neurones dont lensemble des jonctions synaptiques est connu. Un animal XX est hermaphrodite et un animal XO est un mle De nombreux gnes de lHomme ont dabord t identis chez cet organisme

II.D. Drosophila melanogaster

Cet organisme a t utilis pour les travaux gntiques de Morgan. Il possde 4 paires de chromosomes et il y a prsence de chromosomes polytniques dans les glandes salivaires contenant 1024 molcules dADN. La drosophile a servi la ralisation de cartes physiques du gnome (il existe par coloration 5100 bandes, taille moyenne de 26 Kb). Elle a t squence, car il y avait de trs nombreux mutants et ses cartes gntiques taient assez compltes et prcises

II.E. Mus musculus

Le gnome de la souris est plus petit que celui de lHomme, mais cest lorganisme qui sen rapproche le plus. De plus, elle prsente lavantage de pouvoir raliser tous les croisements possibles, il existe des lignes pures et de nombreux mutants. Certaines maladies de la souris sont proches de maladies humaines

III. Les cartes de liaison


Ltude des gnomes a ncessit ltablissement de cartes qui permettent de reprer les marqueurs le long des chromosomes. On distingue les cartes gntiques des cartes physiques. Les cartes de liaisons (carte gntique et carte dirradiation) sont construites partir de marqueurs correspondant des fragments dADN gnomique dnissant un

9 sur 21

Gntique

locus unique. Ces cartes indiquent la position de marqueur les uns par rapport aux autres. Elles ont ensuite t utilises pour tablir les cartes physiques Il y a une diffrence de taille entre une carte physique et une carte gntique. En effet, une carte gntique est base sur le nombre de crossing-over et des zones paraissent plus grandes et dautres plus petites, car il y a des rgions o les crossing-over sont favoriss, dautres o ils sont dfavoriss Pour une carte gntique, les marqueurs sont ordonns grce lanalyse de leur sgrgation au cours de gnrations. Ces cartes sont faciles obtenir chez des organismes ou le nombre de mutants est lev, et/ou la fcondit est forte et le temps de gnration faible Les premires cartes ont t ralises par Morgan et Sturtevant sur la drosophile. Leurs travaux montraient que 2 margeurs (gnes) situs sur le mme chromosome taient transmis prfrentiellement la gnration suivante. Cependant, les observations ont montr que lon ne peut observer la distance entre 2 marqueurs que sils sont polymorphes (reprsents par des allles diffrents et identiables). De plus, le calcul tant statistique, les expriences doivent tre ralises sur des populations importantes Pour un certain nombre dorganismes, la cartographie gntique a t ralise en utilisant comme marqueurs des gnes avec des mutations polymorphes visibles sur le phnotype. Cette approche tait impossible sur lHomme, car la taille des familles est rduite, les marqueurs peu polymorphes Pour les cartes humaines, les marqueurs utiliss ont t de 2 types. Ce sont des fragments dADN dnissant un locus unique dans le gnome. De plus, ces fragments sont visualisables de manire prcise en observant des variations de squences entre les allles. Cependant, ces variations ne s manifestent pas au niveau phnotypique par la modication dun caractre observable: ce sont des marqueurs anonymes 2 types de marqueurs ont t utiliss: les RFLP et les microsatellites

"

"

III.A. Les cartes gntiques

Chez la drosophile ou la souris, les cartes gntiques ont t dresses aprs ltude de nombreux croisements. Chez lHomme, le nombre rduit de mutants polymorphiques et de familles nombreuses na pas permis de raliser des cartes gntiques par ce moyen ! ! ! ! III.A.1. Les marqueurs RFLP
10 sur 21

Gntique

Les fragments RFLP (restriction fragment lenght polymorphism) sont des fragments dADN gnomique qui, lorsquil est utilis comme sonde, permet, aprs digestion enzymatique, la dtection de bandes de taille diffrente. Cette diffrence de taille est due ou des diffrences de position de sites enzymatiques ou la prsence de minisatellites diversement rpts

III.A.2. Les microsatellites

Ce sont des courtes squences dADN rptes en tandem (de 1 13 pb). Chaque microsatellite correspond un locus unique dans le gnome, les rgions entourant ce site tant parfaitement dni. Le polymorphisme de ces loci est d des variations dans la longueur de la rptition qui identie chaque allle Les microsatellites sont beaucoup plus polymorphes que les marqueurs RFLP

III.A.3. Obtention des cartes gntiques humaines

Les cartes gntiques ont t construites de la faon suivante:


11 sur 21

Gntique

Les marqueurs ont t localiss sur un chromosome grce l'utilisation d'hybrides somatiques mono-chromosomiques, soit par FISH (cas des RFLP), soit par PCR (microsatellites)

Lhybride est instable, car le gnome du Hamster prend le dessus et les chromosomes humains sont perdus. On drive une srie de cellules qui a le gnome du hamster + un chromosome humain. On fait ensuite migrer les ARN et on ajoute une sonde ce qui permet de localiser un marqueur sur un chromosome Les marqueurs sont examins 2 2 pour dterminer les groupes de liaison Les groupes de liaison sont ordonns sur les chromosomes ! ! ! ! III.1.4. Les cartes d'hybrides d'irradiation

Les cartes dhybrides dirradiation sont bases sur le mme principe, mais on irradie les cellules humaines somatiques par des rayons X qui vont couper le gnome en morceau L'avantage: il n'est pas ncessaire d'avoir un polymorphisme des marqueurs

12 sur 21

Gntique

"

"

III.B. Le squenage

2 mthodes ont t dveloppes permettant le squenage rapide des ADN: - Mthode de Maxam et Gilbert - Mthode de Sanger cf: Premire partie

"

"

13 sur 21

Gntique

"
!

"
!

III.C. Les cartes physiques


! ! III.C.1. Les cartes locales ou de petits gnomes

Ce sont souvent des cartes de restriction qui sont ralises Chez certaines espces, les caractristiques particulires des chromosomes permettent la ralisation de carte physique. Exemple des chromosomes polythnes chez les diptres ! ! ! ! III.C.2. Les cartes locales chez l'Homme

Les cartes locales ont t ralises grce aux techniques de marche sur le chromosome ou de saut sur le chromosome La technique de marche sur le chromosome consiste prendre un clone A dont on tire une sonde. On squence alors jusqu trouver un deuxime clone B dont on tire une nouvelle fois une sonde et ainsi de suite

14 sur 21

Gntique

Le gne de la mucoviscidose a t squenc de cette faon avant le squenage du gnome humain; il a t publi de 1989 et fait environ 200kb. Ils sont partis du gne IRP qui a t identi comme sgrgeant prfrentiellement avec la maladie La technique du saut sur le chromosome a galement t utilise dans le squenage du gne de la mucoviscidose. Cette technique est plus rapide, mais il y a possibilit de retour en arrire LADN gnomique est digr par des enzymes coupant rarement an davoir de gros fragments; on fait ensuite migrer ces fragments sur gel dlectrophorse; on rcupre les fragments dont la taille est comprise entre 80 et 150Kb On utilise ensuite un plasmide possdant un gne suppresseur de mutations comme le gne supF qui supprime des mutations de lARNt. On sort supF du plasmide puis on le mlange avec les fragments ; on ralise ensuite une ligation avec les fragments dADN. Lutilisation dEcoR1 qui ne coupe pas dans supF va permettre dobtenir le gne supF anqu de deux squences de quelques Kb mais tant en ralit spare de plusieurs dizaines de Kb

On a donc ignor tout ce qui se situe entre ces deux squences ; cest pourquoi cette technique sappelle saut sur le chromosome Les squences obtenues sont clones dans des phages possdant une mutation ambre. On tale alors ces phages sur des bactries supF insertions de supF + forment des plages On peut alors squencer ces squences Remarque : Le problme est quon ne connat pas le sens de linsertion ; il est donc possible de revenir en arrire au lieu davancer sur le chromosome
15 sur 21
-

; seuls les phages possdant des

Gntique

Cette technique sert par exemple quand on ne trouve plus de clones pour continuer une marche sur le chromosome

"

"

III.D. La cartographie physique du gnome humain

Deux approches ont t utilises : une approche chromosome spcique (squenage chromosome par chromosome ce qui a permis dviter la concurrence entre laboratoires) et une approche gnome entier Quelle que soit lapproche, il y a deux voies dordonnancement : top-dowm et bottom-up . Le top-dowm consiste se servir des cartes gntiques mises au point comme point de dpart; on part dune sonde que lon hybride puis on squence jusqu un second marqueur; la technique bottom-up consiste squencer au hasard jusqu tomber sur une squence connue (marqueur) Diffrents types de vecteurs ont t utiliss: plasmide (10-12Kb), cosmides (45Kb), BAC (100-300Kb) et YAC (400Kb)

16 sur 21

Gntique

Cette technique permet dordonner les squences sur les cosmides; puis dordonner les squences des cosmides sur les BAC et ainsi de suite de proche en proche (lordre est prdni) Pour voir que deux clones sont chevauchants; il existe trois faons de faire: Comparaison des prols de restriction des cartes de restriction de chaque clone recouvrant.Deux clones chevauchants prsenteront dans ce cas des fragments de restriction (ngerprint) de mme taille La cartographie par empreinte de restriction permet de gagner du temps, car on ne doit pas tout squencer

Par hybridation : deux clones sont partiellement chevauchants si une sonde drive de lun shybride sur lautre; cette technique est assez peu utilise

Par un contenu commun en marqueur : deux clones sont partiellement chevauchants sils contiennent un mme marqueur unique. La technique utilise est le criblage de la banque de clones; les clones sont tests par PCR avec un marqueur donn (prsence: rponse positive ; absence: rponse ngative). Le STS (squence-tagged site) est un marqueur de choix pour cette cartographie physique

17 sur 21

Gntique

Pour tester de nombreux clones/vecteurs avec un nombre limit de manipulations, on utilise des plaques puits (96). Pour le gnome humain, on a environ 30 000 clones rpartis dans environ 300 plaques. Chaque puits dans la banque correspond un clone de position connue sur le chromosome. Pour tester la prsence dune squence dintrt, on ralise une amplication par PCR ; les clones tant rpartis par super pools puis par pools au sein dun super pool; on peut ainsi faire un criblage selon le systme de pools et de super pools; ce qui permet un gain de temps

L'ensemble de ces donnes a permis la cartographie du gnome humain. Celle-ci doit permettre l'identication rapide de gnes associs des maladies ou dsordres hrditaires

18 sur 21

Gntique

Cette identication est possible pour les maladies monogniques, mais rarement pour les maladies complexes rsultant de l'interaction de plusieurs gnes avec l'environnement (cancer, diabte, insufsance cardiaque...)

III.E. Identication d'un gne responsable d'une maladie monognique


La gnomique structurale (squenage du gnome) a permis lidentication dun certain nombre de gnes responsables de maladies hrditaires Lorsquon veut rechercher le gne responsable dune maladie, on peut raliser plusieurs approches: Clonage biochimique et les thalassmies (maladies du sang lies une dcience en hmoglobine). Cela consiste un clonage fonctionnel; on connat la protine et on veut chercher le gne; cette approche fut la premire ralise, mais dsormais cest la moins utilise. On prlve lADN de membres de familles atteintes par la maladie. On ralise une analyse de liaison avec 200 300 marqueurs rpartis le long du chromosome ; et on voit avec quels marqueurs sgrgent avec la pathologie. On peut alors identier un intervalle gnralement de plusieurs Mb. On utilise une carte physique pour dterminer les YAC analyser

Quand la femme cde le chromosome avec les marqueurs 15. 21. 17, lindividu nest pas malade; on peut ainsi localiser le gne responsable de la maladie. On peut aussi voir que les marqueurs sont lis de cette manire-l

19 sur 21

Gntique

Clonage par gnes candidats : des pathologies similaires chez certains animaux sont identies et on recherche le gne humain correspondant. On ralise un Northern Blot avec une sonde ADN dune autre espce dont on modie lastringence (de faon ce que ce ne soit pas trs spcique) : zoo blot . Cette mthode nest quasiment plus utilise, car ce qui a t dcouvert la t, mais elle pourrait ltre nouveau si on dcouvre de nouvelles maladies par transgense (chaos) chez la souris par exemple Clonage positionnel

IV. Analyse des gnomes


Chez Saccharomyces cerevisiae, le squenage complet a t ralis en 1996. La dtermination du nombre de gnes s'est base sur l'tude des ORF. Il existe 3 ORF par brin donc 3 protines possibles par brin et 6 par double brin. Recherche au hasard des AUG et des codons stop Il existe 16 chromosomes pour 13,391 Mpb et environ 6200 gnes 65% des gnes ont une fonction connue: - 35% trouvs par exprimentation (expression puis fonction) - 30% par homologie de squences Pour ces gnes, 9% sont des gnes spciques de la levure 91% sont partags avec d'autres espces - 14 % des ORF ont une fonction inconnue avec des homologies ORF orphelines - 12% sont des squences sans homologies squences orphelines Chez C. Elegans, beaucoup d'introns apparaissent. D'une manire gnrale, plus un organisme est complexe, et plus le nombre d'introns augmente. Pour connaitre le nombre
20 sur 21

Gntique

de gnes, ralisation de banque d'ADNc. Utilisation des EST (pour expressed sequences tag) qui permettent de reconnaitre 1 gne exprim et qui est spcique de ce gne Il existe 6 paires de chromosomes pour 100 Mpb et environ 19000 gnes Il y a apparition (par rapport la levure) de famille multignique : gnes qui se ressemblent et qui s'expriment (sinon pseudognes). L'expression dans diffrents tissus, des diffrents gnes qui peuvent avoir des fonctions diffrentes, voire antagonistes Les familles multigniques ont donc des gnes homologues (anctre commun) qui peuvent tre orthologue (avoir la mme fonction) ou paralogue (fonctions diffrentes) Chez les mammifres, il y a apparition de fonctions cognitives et sociales ce qui expliquent l'augmentation du nombre de gnes Par exemple chez l'Homme, 23 paires de chromosomes pour 3000 Mpb et 30000 gnes environ. Le gnome est encombr de beaucoup de squence non codantes Il y a 1,2% de squences codantes 0,7% d'UTR 5' et 3' rgions de rgulation post-transcriptionnelle 31% d'introns 6,5 % d'ADN satellites dans les centromres et les tlomres. Ce sont souvent des rptitions (CA)n ou (GT)n Dans l'ADN intergnique, existe les pseudognes, qui sont apparus par duplication puis mutations. Ces pseudognes reprsentent environ 1% du gnome Il y a aussi un certain nombre d'lments gntiques mobiles (50% de l'ADN)

21 sur 21