Forschende der Universität Bielefeld haben sich mit der Frage befasst, wie Transkriptionsfaktoren spezifisch DNA binden. Transkriptionsfaktoren sind Proteine, die steuern, an welcher Stelle die DNA abgelesen wird. Die Arbeitsgruppe um Biologie-Professorin Dr. Andrea Bräutigam untersuchte dafür DNA-Sequenzen der Ackerschmalwand (Arabidopsis thaliana). Theoretisch gibt es viele DNA-Positionen mit Bindung-ermöglichenden Basenpaaren, aber nicht an allen Stellen binden die 216 untersuchten Transkriptionsfaktoren. Die Forschenden haben nun ein Modell entwickelt, das vorhersagt, welche Proteine an welcher Stelle binden können. Die Studie ist am 12. November in Nature Communications veröffentlicht worden.
Die Ackerschmalwand ist eine typische Modellpflanze für DNA-Forschungen, da sie die am besten analysierte Pflanze ist. Für ihre Forschung analysierten die Mitglieder der Arbeitsgruppe zunächst die 3D-Struktur der DNA der Pflanze und die Basenfolgen, an denen Transkriptionsfaktoren binden. „Wir haben uns nicht nur bestimmte Basenmotive angeguckt, also sich wiederholende Abfolgen der Basenpaare in der DNA, sondern auch auf ihre Struktur im Raum geachtet“, sagt Janik Sielemann, Erstautor der Studie und Doktorand in der Arbeitsgruppe.
In der dreidimensionalen Doppelhelix der DNA können die Basenpaare unterschiedlich zueinander stehen: Sie können zum Beispiel dicht beieinander, etwas weiter voneinander entfernt, geneigt oder auch verschoben sein. „Wir wollten testen, ob die räumliche Struktur eine wichtige Rolle spielt“, sagt Sielemann. „Also haben wir durch maschinelles Lernen ein Modell entwickelt, mit dem wir Vorhersagen darüber treffen können, welche Proteine wo binden werden.“ Dieses sollte zunächst anhand der Kombination der Basenfolgen und ihrer Struktur Bindungsmuster erkennen.
„Wir sind davon ausgegangen, dass es kombinatorische oder auch nicht-lineare Beziehung gibt“, sagt Bräutigam. Für Anwendungen mit vielen unterschiedlichen Faktoren, die auf ungeklärte Weise miteinander in Beziehung stehen, eignen sich Anwendungen des maschinellen Lernens ganz besonders. Sie sind darauf ausgelegt, bestimmte Muster in sehr großen Datensätzen zu erkennen. „Ein Mensch könnte das möglicherweise auch, aber er würde dafür sehr viel mehr Zeit benötigen“, sagt die Wissenschaftlerin.
Tatsächlich ließen sich dadurch bestimmte, wiederkehrende Muster in der DNA erkennen, die einen Einfluss auf die Bindung eines Transkriptionsfaktors zu haben schienen. „Die räumliche Struktur der DNA war für uns die Erklärung, warum ein Transkriptionsfaktor nicht an alle identischen Basenfolgen binden, sondern nur an ganz bestimmten Stellen“, sagt Bräutigam.
Die Forschenden wollten ihre Ergebnisse daraufhin experimentell validieren, also in der Anwendung überprüfen. „Es ging uns darum, das biologische Vorhersagepotenzial zu testen“, erläutert die Professorin. Dafür verwendete die Gruppe verschiedene, eigens angefertigte DNA-Sequenzen. „Diese Sequenzen kommen in unserer Modellpflanze gar nicht vor.“ Daraufhin ließen sie den Algorithmus Vorhersagen darüber treffen, an welchen Stellen dieser Sequenzen die Transkriptionsfaktoren binden würden – und an welchen nicht. „Wir lagen meist richtig.“
Diese Grundlagenforschung ist wichtig, da bislang zu wenig verstanden ist, wie Gene reguliert sind und wie das die Antwort der Pflanzen beispielsweise auf widrige Umweltbedingungen steuert. „Das ist ein ungelöstes Problem für fast alle Organismen“, sagt die Professorin. Eine präzise Vorhersage der Bindung ist ein erster Schritt, Genregulation besser vorherzusagen. Solche Vorhersagen spielen auch in der Landwirtschaft eine Rolle, da ein solches Verständnis zielgerichtete Züchtung ermöglichen kann. „In Zukunft wird es darum gehen, die Informationen zur Proteinbindung von der Ackerschmalwand auch auf andere Spezies zu übertragen“, sagt Bräutigam. „Wir hoffen, dass man auch dort durch maschinelles Lernen herausfinden kann, wo und wann Gene offen für Bindungen sind.“