Vordergründig gaben die beiden Professoren HHU-Studierenden eine typische Aufgabe für Bioinformatiker: Sie sollten zwei Datensätze analysieren, die – getrennt nach männlichen und weiblichen Patienten – deren Body-Mass-Index (BMI) und deren tägliche Schrittzahl enthielten.
Die Studierenden waren in zwei Gruppen geteilt: Die eine wurde nur gefragt, was sie aus den Daten lernen können. Die andere Gruppe erhielt zusätzlich die Aufgabe, drei verschiedene Hypothesen zu prüfen; zum Beispiel, ob sich die Schrittzahlen von Frauen und Männern signifikant unterscheiden.
Was die Studierenden nicht wussten: Ihre Hochschullehrer hatten eine ganz andere Intention bei der Aufgabenstellung. Sie wollten sehen, wie sehr ein vorgegebener Analysepfad die wissenschaftliche Kreativität einschränkt.
Dazu hatten sie einen Datensatz erzeugt, der nichts mit der beschriebenen Thematik zu tun hatte. Vielmehr zeigte er das einfache Bild eines Gorillas, wenn man die jeweiligen Datenpaare in einem simplen zweidimensionalen Diagramm gegeneinander aufträgt. Dazu Prof. Lercher von der Arbeitsgruppe für Computergestützte Zellbiologie der HHU: „Eine solche einfache Visualisierung von Daten gehört zum Handwerkszeug beim Umgang mit Daten, das wurde bereits in den ersten Vorlesungen zur Datenauswertung gründlich behandelt.“
Tatsächlich fand aber ein großer Teil der Studierenden, die mit vorgegebenen Hypothesen an die Daten herangingen, den Gorilla nicht. Fünfmal so oft übersahen sie ihn im Vergleich zu ihren frei analysierenden Kommilitonen.
Übergeordnet ist diese Fragestellung unter die Begriffe ‚Day Science‘ und ‚Night Science‘ zu fassen, und in einer Artikelserie hierzu erschien auch das Paper in ‚Genome Biology‘. Die Konzentration auf ‚Day Science‘ unterscheidet die moderne Wissenschaft von der Naturphilosophie: Man überprüft Vermutungen durch geplante Experimente – hier werden keine Entdeckungen gemacht, sondern Hypothesen rigoros getestet. ‚Night Science‘ ist dagegen der unsystematische, der kreative Teil der Wissenschaft: Die Forschenden erfinden neue Fragen, Ideen und Hypothesen.
Prof. Yanai betont: „Wir möchten mit unserer Arbeit dazu anregen, dass mehr über die kreative Seite der Wissenschaft gesprochen wird. Unsere Analyse zeigt: Wer im ‚Day-Science-Modus‘ verhaftet ist, verpasst leicht spannende Entdeckungen.“
Damit waren die Autoren sehr erfolgreich: In der Analyse von rund 3,4 Millionen im Jahr 2020 erschienen Veröffentlichungen aus allen möglichen Fachbereichen gehört ihr Artikel „A hypothesis is a liability“ auf Platz 63 zu den 100 meist diskutierten. Im Bereich der ‚Information and Computing Sciences‘ steht es sogar auf Platz 5. Um auf diese Zahl zu kommen, hat die auf Bibliometrie spezialisierte Plattform Altmetrics alle auffindbaren Online-Nennungen zu den analysierten Artikeln gezählt, insgesamt waren fast 88 Millionen erfasst worden.
Hierzu zählen Nennungen unter anderem in Blogs und Social-Media-Plattformen wie Facebook und Twitter. Vor allem bei Twitter war das Paper erfolgreich, es wurde 2566-mal retweetet. Martin Lercher: „Wir waren selbst erstaunt, wie oft unser Artikel geteilt und kommentiert wurde. Das Ergebnis hat vielleicht einen wunden Punkt getroffen: dass wir Wissenschaftler uns mehr Raum für kreative Ideen lassen sollten.“
HHU
Originalpublikation:
Itai Yanai & Martin Lercher, A hypothesis is a liability, Genome Biology 21, 2021, DOI: 10.1186/s13059-020-02133-w