VBIO

Biowissenschaften in der Mitte der Gesellschaft 

Der VBIO übernimmt Verantwortung, stellt sich dem Diskurs und bezieht Position.

Aktuelles aus den Biowissenschaften

KI-Tool „Helixer“ entdeckt Gene in unbekannten Organismen

Grafik: KI-Tool „Helixer“ entdeckt Gene in unbekannten Organismen
KI-Tool „Helixer“ entdeckt Gene in unbekannten Organismen, Copyright: Forschungszentrum Jülich

Bevor Biologinnen und Biologen Aussagen über die genetischen Eigenschaften eines Organismus treffen können, müssen sie zunächst wissen, wo sich die Gene in der langen Abfolge der DNA-Bausteine befinden. Dieser Prozess, die sogenannte strukturelle Genannotation, gehört zu den anspruchsvollsten Schritten der Genomanalyse. Bislang waren dafür umfangreiche experimentelle Daten oder gut untersuchte verwandte Arten notwendig. Helixer vereinfacht und beschleunigt diesen Schritt nun erheblich, indem es Gene direkt aus DNA-Sequenzen bestimmt – ohne Laborversuche oder Vorwissen über den untersuchten Organismus. 

Forscherinnen und Forscher des Forschungszentrums Jülich und der Heinrich-Heine-Universität Düsseldorf haben mit Helixer ein Werkzeug entwickelt, das die Genforschung spürbar verändern könnte. Die KI erkennt typische Merkmale von Genen direkt aus den Genomsequenzen. Dazu gehören etwa Start- und Stoppsignale, sogenannte nicht-translatierte Bereiche (untranslated region, UTR), die nicht in Proteine übersetzt werden sowie strukturelle Elemente wie kodierende DNA-Sequenzen (coding DNA sequence, CDS), welche die Bauanleitung für Proteine enthalten und Zwischenstücke, Introns.

„Es ist, als würde man in einem völlig unbekannten Buch plötzlich Absätze, Kapitel und einzelne Wörter erkennen“, erklärt Marie Bolger vom Jülicher Institut für Bioinformatik (IBG-4). „Das macht die Genomforschung deutlich schneller.“

Ähnlich präzise wie klassische Verfahren

Helixer ist das erste KI-Werkzeug, das Gene in so unterschiedlichen Organismengruppen – von Pflanzen und Pilzen über Insekten bis zu Wirbeltieren – zuverlässig bestimmen kann. Weltweit werden jedes Jahr Tausende Genome entschlüsselt, viele davon von bislang kaum erforschten Arten. Für sie kann Helixer nun sofort nutzbare Geninformationen liefern, für die zuvor oft monatelange Analysen erforderlich waren.

Die KI sagt die Grenzen von Genen voraus und erreicht dabei nahezu die Qualität manuell kuratierter Referenzannotationen – ganz ohne zusätzliche Daten. Bei Wirbeltieren erzielt Helixer eine hohe Genauigkeit und übertrifft etablierte Genprädiktionswerkzeuge über ein breites Artenspektrum hinweg. Insbesondere bei Pflanzen zeigt Helixer mit seinen Deep-Learning-Ansätzen eine deutlich bessere Vorhersage der Genstruktur.

Das Konzept für Helixer hatte das Forschungsteam bereits im Jahr 2020 vorgestellt und seitdem zu einem Tool weiterentwickelt, das praktisch nutzbare Ergebnisse erzielt. Ein weiteres, ebenfalls auf Deep Learning basierendes Tool zur Genannotation der Universität Greifswald, Tiberius, das 2024 veröffentlicht wurde, erreicht derzeit sogar noch bessere Ergebnisse für Säugetierarten, ist jedoch auf diese taxonomische Gruppe beschränkt.

Neue Impulse für das Forschungsfeld

„Wir konnten zeigen, dass Helixer für eine Vielzahl von Organismen funktioniert, was für den Einsatz in der Pflanzenzüchtung, Biotechnologie und Umweltforschung entscheidend ist“, betont Bolger. „Diese Fortschritte in der KI-gestützten Genannotation sind für das Fachgebiet wirklich spannend.“

Die Genomsequenzierung wurde bereits vor mehr als 20 Jahren automatisiert und hat seither eine enorme Datenfülle hervorgebracht. Die Genannotation galt dagegen lange Zeit als Flaschenhals der Genomanalyse. Nun holt sie langsam auf. „Fast zwei Jahrzehnte lang gab es in diesem Bereich keine grundlegend neuen Ansätze“, sagt Björn Usadel, Direktor des Instituts für Bioinformatik am Forschungszentrum Jülich und Professor an der Heinrich-Heine-Universität Düsseldorf. „Helixer zeigt, dass moderne KI-Methoden helfen können, diesen Engpass zu überwinden.“

Ausblick

Die zunächst als Preprint auf bioRxiv veröffentlichten und nun in Nature Methods erschienenen Ergebnisse wurden bereits vielfach zitiert und haben in der Fachgemeinschaft bereits viel Resonanz erfahren. „Wir sehen bereits, dass Helixer in vielen Projekten eingesetzt wird – von Nutzpflanzen bis hin zu Insekten, die ganze Ökosysteme prägen“, sagt Usadel. Zukünftige Entwicklungen sind bereits im Gange: Felicitas Kindel, Doktorandin am IBG-4, erforscht innovative Strategien, um die Fähigkeiten von Helixer zu erweitern.

Forschungszentrum Jülich


Originalpublikation: 

Holst, F., Bolger, A.M., Kindel, F. et al. Helixer: ab initio prediction of primary eukaryotic gene models combining deep learning and a hidden Markov model. Nat Methods (2025). doi.org/10.1038/s41592-025-02939-1

weitere VBIO News
Weberknecht der Art Vononana adrik aus der, Weberknecht-Familie Cosmetidae nachts im amazonischen, immergrünen Tieflandregenwald, Panguana, Peru – unter UV Licht.

Leuchtende Signale im Regenwald

Weiterlesen
Fadenwürmer

Wie sich räuberische Aggression bei Fadenwürmern entwickelte

Weiterlesen
Aquarius paludum – heimischer Wasserläufer der Gerrinae

Vielfalt der Wasserläufer entstand früher als angenommen

Weiterlesen