Next Generation Sequencing

Dipl. Ing. Marius Kuhn, Prof. Dr. med. Horst Hameister
Neue DNA-Sequenzier-Techniken, zusammengefasst unter dem Namen „Next Generation Sequencing“, haben mittlerweile Eingang in die genetische Praxis gefunden. Welche Vorteile bietet diese neue Technik und wie wird sie in der genetischen Diagnostik zur Zeit eingesetzt? Eine Antwort darauf finden Sie in diesem Beitrag.
Seit etwa zehn Jahren wird an verschiedenen neuen Methoden der DNA-Sequenzierung experimentell gearbeitet. Diese Methoden haben inzwischen die Sequenzier-Technik revolutioniert und werden unter  dem  Begriff  Next  Generation  Sequencing (NGS)  zusammengefasst.  Mittlerweile  werden auch  die  ersten  Ergebnisse  in  der  wissenschaftlichen  Literatur  vorgestellt,  die  mit  diesen  neuen  Techniken  erhalten  wurden.  Diese  Techniken haben nicht nur die DNA-Sequenzierung auf eine völlig neue Basis gestellt, sondern sie sind dabei, auch auf vielen anderen Gebieten der Biologie das experimentelle Vorgehen zu revolutionieren. Neueste Nachrichten legen nahe, dass auch dies nur ein Schritt zu einer noch viel weitergehenden Vereinfachung der Genomsequenzierung sein wird.


Massives paralleles Sequenzieren

Über 30 Jahre lang hat alleine die Sanger-Sequenzierung  durch  das  Kettenabbruch-Verfahren  die Szene  beherrscht.  Hier  erfolgt  in  einer  Reaktion die  Sequenzierung  eines  Einzelfragments  mit  bis zu  800  Basenpaaren  durch  Kettenabbrüche  und elektrophoretische  Auftrennung  der  unterschiedlich  langen  Syntheseprodukte.  Ein  Sequenzierroboter  erreicht  je  nach  Modell  etwa  100  kb  pro Tag.  In  den  großen  Labors  standen  20  und  mehr dieser  Sequenzierroboter  nebeneinander,  um  einen höheren Durchsatz zu erlangen. Bei der Next Generation Sequencing-Technik wird ein vollkommen  anderes  Vorgehen  gewählt.  Es  werden  in massiver  Weise  parallel  Tausende  bis  Millionen von  verschiedenen  DNA-Fragmenten  gleichzeitig sequenziert.  Dies  wird  durch  die  Fixierung  eines Einzelfragments  an  einer  Oberfläche  ermöglicht, beispielsweise kleiner Kügelchen (beads) oder einer Glasoberfläche ähnlich der DNA-Chips. Dieses Einzelfragment  wird  anschließend  um  ein  Vielfaches amplifiziert. Die Sequenzierung erfolgt lokal begrenzt an der besagten Oberfläche und bleibt an ihr gebunden. Dadurch können parallel Tausende bis Millionen Fragmente gleichzeitig praktisch im selben  Volumen  synthetisiert  werden.  Die  neuen Geräte  erlauben  es  zudem,  die  Sequenzierreaktion selbst jeweils Base für Base spezifisch sichtbar zu machen. Die Methoden, um diese Sequenzierreaktionen optisch aufzunehmen, sind sehr unterschiedlich – auch das zeigt, welchen erstaunlichen  Innovationsschub  es  hier  in  kurzer  Zeit  gegeben  hat.  Anschließend  müssen  die  Sequenzen dieser meist sehr kurzen Einzelfragmente von 25 bis  400  Basenpaaren  geordnet  aneinandergereiht werden.  Das  geschieht  in  der  Humangenetik  unter  Zuhilfenahme  des  bekannten  menschlichen Referenzgenoms,  dessen  Mastermatrix  seit  2001 bekannt  ist.  Bei  bisher  unbekannten  Genomen, wie  zum  Beispiel  denen  verschiedener  Mikroorganismen,  erfordert  diese  Genomassemblierung ganz andere bioinformatische Techniken. Möglich wird dieser exakte Genomaufbau jedoch, weil das Genom  insgesamt  nicht  nur  einmal  synthetisiert wird, sondern so viele Fragmente, dass sie zusammen dem 30-fachen des ganzen Genoms entsprechen. Man spricht in diesem Zusammenhang von einer  „30-fachen  Genom-Coverage“.  Diese  Zahlen mögen noch einmal einen Eindruck davon geben, was in diesem Fall massives paralleles Sequenzieren heißen kann. Mit  dieser  Hochdurchsatzsequenzierung  ist  es möglich,  ein  menschliches  Genom  in  einem  Sequenzierlauf  zu  analysieren.  Es  folgen  jedoch noch  weitere  arbeitsintensive  Schritte:  zunächst das bereits erwähnte Anordnen der Sequenzen zu einem  Genom,  und  anschließend  das  Auswerten der  Sequenzdaten.  Für  diese  Schritte  wird  eine ausgeklügelte bioinformatorische Expertise benötigt,  die  die  herkömmliche  Auswertung  bei  weitem übersteigt.





Abb. 1: Qualitätskontrolle eines Sequenzierlaufes. Die Aufnahme im Monitor zeigt einen kleinen Bereich der Picotiterplatte. Die einzelnen Punkte spiegeln die jeweiligen Wells wieder, wobei sich in einem Well genau ein „bead“ befindet. Grün: auswertbare Sequenzierungen, die den Filterkriterien entsprechen, Rot: nicht berücksichtigte Sequenzierungen, da sie den Qualitätsfilter nicht passieren konnten.

Whole Exome Sequencing

Die  durchschnittliche  Abweichung  der  DNA-Sequenzdaten  zwischen  zwei  Menschen  beträgt  etwa 1:1.000; das heißt, in jedem neu sequenzierten Genom  finden  sich  über  drei  Millionen  Einzelbasen-Sequenzvarianten zum Referenzgenom. Es ist also praktisch unmöglich, bei einem Patienten die für  seine  Erkrankung  verantwortliche  Sequenzvariante  bzw.  Mutation  in  diesem  Heuhaufen  zu erkennen. Da man so mit diesen Daten heute keine Diagnostik betreiben kann, hat man das Next Generation Sequencing für die Praxis auf relevante Genombereiche  eingeschränkt.  Am  bekanntesten ist heute wohl das Whole Exome Sequencing. Dabei  werden  nur  die  Exons  der  Gene  sequenziert, also die Sequenzen, die in Eiweiße übersetzt werden (siehe Abb. 2). Das gesamte Exom macht nur etwa  ein  bis  zwei  Prozent  der  DNA  aus  und  ist in seiner Sequenz sehr viel höher konserviert als die  übrige  DNA.  Trotzdem  muss  man  bei  einem solchen Whole Exome Sequencing noch mit etwa 20.000  bis  50.000  Varianten  rechnen.  Um  diese Varianten in ihrer Qualität zu unterscheiden, werden verschiedene Kriterien angewandt. Insbesondere  werden  nur  solche  Varianten  analysiert,  die auch tatsächlich zu einer Aminosäure-Substitution bzw.  zu  einer  Spleiß-Variante  oder  Stopp-Mutation führen. Zuvor werden jedoch schon bekannte Sequenz-Varianten  bzw.  Polymorphismen  ausgeschlossen.  Nach  all  diesen  Ausschlussverfahren verbleiben  typischerweise  immer  noch  etwa  150 bis  500  solcher  individueller  bzw.  privater  Sequenz-Varianten bei einem Patienten. Daher ist es nötig,  bei  der  weiteren  Analyse  dieser  Varianten ganz  individuell  vorzugehen,  um  die  tatsächlich alleinige pathogene Mutation aufzufinden. Da hilft ein  tiefes  biochemisches  Verständnis  des  Krankheitsbilds des Patienten, eine ungefähre vorherige Lokalisation im Genom und manchmal kann auch die Familiensituation sehr informativ sein. An dieser  Stelle  ist  immer  noch  das  Können  des  klinischen Genetikers gefragt.





Abb. 2: Darstellung einer Exom-Sequenzierung mit der Plattform „Genome Analyzer II“ der Firma Illumina. Die Visualisierung erfolgte im Genome Browser IGV (Integrated Genomic Viewer). Zu sehen sind Exon 5 (links) und Exon 6 (rechts) des PTPN11-Gens aus der Region des Chromosoms 12q24.13 und die Zusammensetzung der einzeln sequenzierten Fragmente.

Anwendungsbeispiele

Die  Methode  des  Whole  Exome  Sequencing  wurde  tatsächlich  angewandt,  um  für  schon  lange bekannte  Krankheitsbilder  die  pathogene  Mutation  und  damit  auch  das  verursachende  Gen  zu finden. Die erste erfolgreiche Anwendung gelang der  Arbeitsgruppe  Ng  et  al.  im  Jahre  2010,  die für  das  Miller-Syndrom,  eine  akrofaziale  Dysostose, krankheitsverursachende Veränderungen im DHODH-Gen identifizierten, das zuvor noch nicht mit dieser Erkrankung assoziiert wurde. Ein weiteres bekanntes Beispiel ist das Kabuki-Syndrom, für  das  im  selben  Jahr  bei  Patienten  Mutationen im MLL2-Gen beschrieben wurden. Man  erhält  durch  das  Whole  Exome  Sequencing allerdings  auch  für  viele  Gene,  die  man  eigentlich nicht untersuchen wollte, Varianten, die nach allen  uns  bekannten  Kriterien  pathogen  sind.  Es stellt sich dann das Problem, wie man den Patienten gegenüber mit dieser Information umgeht.

Targeted Exon Sequencing

Der  Ansatz  des  Whole  Exome  Sequencing  ist  für die  genetische  Praxis  auf  Grund  des  hohen  Aufwandes hinsichtlich der bioinformatorischen Bearbeitung und der möglichen Probleme derzeit kaum gangbar. In der Praxis setzt sich zur Zeit eine Anwendung  durch,  bei  der  eine  weitere  Beschränkung vorgenommen wird: „Targeted Exon Sequencing“. Diese Technik ist bei genetisch heterogenen Krankheitsbildern informativ. Am genetikum wird diese Technik derzeit für die Diagnostik des Noonan-Syndroms und seiner verwandten Krankheitsbilder angewandt. Mutationen sind in verschiedenen Genen möglich. Zum jetzigen Zeitpunkt sind dies die Gene PTPN11, BRAF, HRAS, KRAS, MEK1, MEK2,  RAF1  und  SOS1.  Bisher  wurde  bei  dieser Diagnostik stufenweise zunächst das am häufigsten  betroffene  PTPN11-Gen  und  anschließend  ein Gen  nach  dem  anderen  sequenziert.  Jetzt  ist  es möglich, alle ca. 100 Exons dieser acht Gene parallel  in  einer  Reaktion  zu  vervielfältigen  und  zu analysieren. Dies ist sowohl sehr viel zeitsparender als auch kostengünstiger als das Whole Exome Sequencing. Eine  besondere  Schwierigkeit  dieser  Technik soll  jedoch  nicht  unerwähnt  bleiben.  Sie  betrifft bei  diesem  gezielten  Analysieren  von  einzelnen Genen  die  Präparation  der  entsprechenden  DNA-Abschnitte des Patienten, die als Template für die Sequenzierreaktion dienen (in diesem Fall die ca. 100 Exons, die die acht Gene repräsentieren). Diese  Präparation  muss  garantieren,  dass  diese Templates alle vollständig und in annähernd gleicher  Häufigkeit  angereichert  werden,  und  ebenso  muss  die  Fixierung  dieser  Templates  auf  den Oberflächen sehr gleichmäßig erfolgen, damit die Sequenzierreaktion  die  gewünschten  Bereiche gleichermaßen  und  vollständig  abdeckt.  Der  Vorteil  einer  solchen  gezielten  Analyse  von  bekannten Genen ist nicht nur der sehr viel kostengünstigere  Ansatz  und  die  schnellere  Durchführung, sondern  beispielsweise  auch  die  Begrenzung  der bioinformatorischen  Bearbeitung  auf  wenige  bekannte  Gene.  Eine  Kostenersparnis  erfolgt  allerdings  nur  bei  einer  gleichzeitigen  Untersuchung mehrerer Patienten. Dies gelingt bei einem hohen Probenaufkommen  oder  durch  das  Sammeln  von Patientenproben,  was  die  Bearbeitungszeit  nicht zwingend  verkürzt  und  ein  ständiges  Abwägen der beiden Faktoren Kosten und Zeit erfordert.

Neue Testverfahren und ihre Ergebnisse

Die  einzelnen  Plattformen,  mit  denen  das  Next Generation  Sequencing  zur  Zeit  durchgeführt wird,  unterscheiden  sich  sehr  voneinander  und es  werden  laufend  neue  Plattformen  entwickelt. Jede  einzelne  Plattform  hat  verschiedene  Vor-, aber auch Nachteile – beispielsweise sind für das  Erkennen von Copy-Number-Varianten und strukturellen  Umlagerungen  des  Genoms  nicht  alle Plattformen geeignet. Erstaunlich ist jedoch, welche  Informationsfülle  man  durch  dieses  massive parallele Sequenzieren bei einer bis zu 30-fachen Genomabdeckung  erreichen  kann.  Dies  soll  zum Abschluss beispielhaft an dem neuen Test für das Down-Syndrom  gezeigt  werden,  der  am  mütterlichen  Blut  durchgeführt  wird.  Es  ist  schon  lange bekannt, dass bei Schwangeren degradierte DNA des Embryos im Serum der Mutter mit einem variablen Anteil von im Mittel 10% vorkommt. Diese DNA hat eine relativ kurze Halbwertszeit von wenigen Minuten im mütterlichen Blut. Bei der neuen Technik wird die gesamte DNA aus dem mütterlichen Serum extrahiert und massiv durch Next Generation Sequencing sequenziert. Dabei gelingt es  tatsächlich  bei  einer  Schwangerschaft  mit  Trisomie 21 einen Dosisunterschied von Chromosom 21-DNA,  die  im  Embryo  in  dreifacher  Kopienzahl vorliegt, im Serum der Mutter nachzuweisen.

Schlussbemerkung

Am  genetikum  werden  in  Zukunft  weitere  Gen-Panels mit gezielter Anreicherung und Sequenzierung  angeboten.  Darunter  fallen  muskuläre  und neuromuskuläre Erkrankungsbilder sowie Skelett- und  Bindegewebserkrankungen,  von  denen  bekannt ist, dass sie genetisch heterogen sind und deren Analyse mit den bisherigen Techniken viel zu aufwendig gewesen wäre.