VBIO
Aktuelles aus den Biowissenschaften

Den Gorilla vor lauter Hypothesen nicht sehen

In den vorgegebenen Daten versteckte sich das Bild eines Gorillas, den die Studierenden leicht erkennen konnten
In den vorgegebenen Daten versteckte sich das Bild eines Gorillas, den die Studierenden leicht erkennen konnten, wenn sie die Datensätze gegeneinander auftrugen. Martin Lercher

Finden Studierende ein Gorillabild in einem Datensatz? Der Bioinformatikprofessor Dr. Martin Lercher von der Heinrich-Heine-Universität Düsseldorf (HHU) und sein Kollege Prof. Dr. Itai Yanai von der New York University haben gemeinsam ein Experiment zur Kreativität in der Wissenschaft gemacht: Im vergangenen Jahr beschrieben sie in ‚Genome Biology‘, dass die Probanden deutlich seltener den Gorilla entdeckten, wenn sie die Daten mit vorgegebenen Hypothesen untersuchten. Laut Analyseplattform Altmetrics gehört dieser Artikel zu den Top-100 der meistdiskutierten wissenschaftlichen Arbeiten des Jahres 2020.

Vordergründig gaben die beiden Professoren HHU-Studierenden eine typische Aufgabe für Bioinformatiker: Sie sollten zwei Datensätze analysieren, die – getrennt nach männlichen und weiblichen Patienten – deren Body-Mass-Index (BMI) und deren tägliche Schrittzahl enthielten.

Die Studierenden waren in zwei Gruppen geteilt: Die eine wurde nur gefragt, was sie aus den Daten lernen können. Die andere Gruppe erhielt zusätzlich die Aufgabe, drei verschiedene Hypothesen zu prüfen; zum Beispiel, ob sich die Schrittzahlen von Frauen und Männern signifikant unterscheiden.

Was die Studierenden nicht wussten: Ihre Hochschullehrer hatten eine ganz andere Intention bei der Aufgabenstellung. Sie wollten sehen, wie sehr ein vorgegebener Analysepfad die wissenschaftliche Kreativität einschränkt.

Dazu hatten sie einen Datensatz erzeugt, der nichts mit der beschriebenen Thematik zu tun hatte. Vielmehr zeigte er das einfache Bild eines Gorillas, wenn man die jeweiligen Datenpaare in einem simplen zweidimensionalen Diagramm gegeneinander aufträgt. Dazu Prof. Lercher von der Arbeitsgruppe für Computergestützte Zellbiologie der HHU: „Eine solche einfache Visualisierung von Daten gehört zum Handwerkszeug beim Umgang mit Daten, das wurde bereits in den ersten Vorlesungen zur Datenauswertung gründlich behandelt.“

Tatsächlich fand aber ein großer Teil der Studierenden, die mit vorgegebenen Hypothesen an die Daten herangingen, den Gorilla nicht. Fünfmal so oft übersahen sie ihn im Vergleich zu ihren frei analysierenden Kommilitonen.

Übergeordnet ist diese Fragestellung unter die Begriffe ‚Day Science‘ und ‚Night Science‘ zu fassen, und in einer Artikelserie hierzu erschien auch das Paper in ‚Genome Biology‘. Die Konzentration auf ‚Day Science‘ unterscheidet die moderne Wissenschaft von der Naturphilosophie: Man überprüft Vermutungen durch geplante Experimente – hier werden keine Entdeckungen gemacht, sondern Hypothesen rigoros getestet. ‚Night Science‘ ist dagegen der unsystematische, der kreative Teil der Wissenschaft: Die Forschenden erfinden neue Fragen, Ideen und Hypothesen.

Prof. Yanai betont: „Wir möchten mit unserer Arbeit dazu anregen, dass mehr über die kreative Seite der Wissenschaft gesprochen wird. Unsere Analyse zeigt: Wer im ‚Day-Science-Modus‘ verhaftet ist, verpasst leicht spannende Entdeckungen.“

Damit waren die Autoren sehr erfolgreich: In der Analyse von rund 3,4 Millionen im Jahr 2020 erschienen Veröffentlichungen aus allen möglichen Fachbereichen gehört ihr Artikel „A hypothesis is a liability“ auf Platz 63 zu den 100 meist diskutierten. Im Bereich der ‚Information and Computing Sciences‘ steht es sogar auf Platz 5. Um auf diese Zahl zu kommen, hat die auf Bibliometrie spezialisierte Plattform Altmetrics alle auffindbaren Online-Nennungen zu den analysierten Artikeln gezählt, insgesamt waren fast 88 Millionen erfasst worden.

Hierzu zählen Nennungen unter anderem in Blogs und Social-Media-Plattformen wie Facebook und Twitter. Vor allem bei Twitter war das Paper erfolgreich, es wurde 2566-mal retweetet. Martin Lercher: „Wir waren selbst erstaunt, wie oft unser Artikel geteilt und kommentiert wurde. Das Ergebnis hat vielleicht einen wunden Punkt getroffen: dass wir Wissenschaftler uns mehr Raum für kreative Ideen lassen sollten.“

HHU


Originalpublikation:

Itai Yanai & Martin Lercher, A hypothesis is a liability, Genome Biology 21, 2021, DOI: 10.1186/s13059-020-02133-w

https://doi.org/10.1186/s13059-020-02133-w