Mit dem Geist der japanischen Poesie zur innovativen Datenwissenschaft
Das Swiss Data Science Center der ETH Lausanne und der ETH Zürich ist erfolgreich gestartet. Bereits im September konnten die Wissenschaftler des Zentrums ihre Open-Source Plattform Renga lancieren. Nun wurden auch die ersten Forschungsprojekte bestimmt, die gef?rdert werden sollen.
Renga ist eine Form des japanischen Gedichts, das mehrere Dichter gemeinsam schreiben. Dabei wechseln sie sich jeweils Vers um Vers ab. Die einzelnen Beitr?ge fügen sich zu einem Ganzen zusammen. Renga ist auch der Name einer neuen Open-Software-Plattform, die nach demselben Prinzip funktioniert. Forschende aus den Natur-, Technik- und Sozialwissenschaften erarbeiten im Austausch mit Datenspezialisten neue L?sungsans?tze. Entwickelt haben die Plattform Wissenschaftler des Swiss Data Science Centers. Dieses gemeinsame Zentrum der EPFL und der ETH Zürich bildet eine Brücke zwischen Forschenden, die Daten produzieren und jenen, die neue Techniken der Datenanalyse und Datensysteme entwickeln.
Daten teilen, Wissen vermehren
Die neuartige, in der Cloud gehostete Plattform ist für Analysen verschiedenster Art gebaut. Forschende aus unterschiedlichsten Fachgebieten k?nnen in ihr geordnete, kalibrierte und falls n?tig anonymisierte Daten speichern und analysieren. Der Clou an der Geschichte: die Plattform w?chst mit jedem Forschungsprojekt, wird um wertvolle Daten reicher, die dann wieder anderen Wissenschaftlern zur Verfügung stehen. Da auch Datenwissenschaftler die Daten für ihre Forschung nutzen k?nnen, kommt ein Austausch über L?sungsans?tze in Gang, der neue Erkenntnisse und weitere Forschungsprojekte erm?glicht. So f?rdert Renga nicht nur eine multidisziplin?re Zusammenarbeit, sondern auch wissenschaftliche Transparenz und Methodenentwicklung.
Seit September steht die Plattform den Wissenschaftlern zur Verfügung, aber auch Unternehmen profitieren: an einem Industrietag wurde ihnen aufgezeigt, wie sie Data Science schnell für ihre Gesch?ftsbereiche nutzbar machen k?nnen. Auch sie k?nnen in Zukunft ihre Daten auf die Plattform spielen und für die Analyse auf die Expertise von Datenwissenschaftlern und Informatikern des Swiss Data Science Centers zugreifen.
Kompetenzen verbinden und beflügeln
?Die Plattform, die wir gebaut haben, ist einzigartig, weil sie ganz praktisch die Leistungsf?higkeit und die Exzellenz der Forschung f?rdert und die Einführung der Open Data Science unterstützt?, sagt Olivier Verschure, Executive Direktor des SDSC. Eine besondere Herausforderung sei es gewesen, die Plattform benutzerfreundlich zu gestalten. Schliesslich sollen sie Forschende nutzen, die nicht aus der Informatik oder den Datenwissenschaften kommen. Andreas Krause, Professor für Informatik an der ETH Zürich und Co-Direktor des Zentrums für Datenwissenschaften fügt an: ?Wir verbinden datenwissenschaftliche Methoden wie maschinelles Lernen oder Statistik mit den Kompetenzen von datenreichen Wissenschaften wie Lebens- oder Umweltwissenschaften.?
Projekte ausgew?hlt
Wie die Plattform Renga haben auch die F?rderbeitr?ge des Swiss Data Science Centers das Ziel, interdisziplin?re Projekte aus dem Bereich Datenwissenschaften zu f?rdern. Die F?rderung bel?uft sich auf zwei Jahre und betr?gt je nach Projekt 300'000 bis 600'000 Schweizer Franken. Die erste Ausschreibungsrunde ist vor kurzem abgelaufen. Beworben haben sich 74 Forschende des ETH-Bereichs (ETH, EPFL, PSI, WSL, Empa, Eawag) aus 10 Disziplinen. Ausgew?hlt hat das SDSC acht Projekte, wobei an vier von ihnen Forschende der ETH Zürich beteiligt sind. Die ETH-Projekte stammen vor allem aus den Umwelt– und Gesundheitswissenschaften aber auch Deep Learning ist dabei ein wesentlicher Bestandteil.
Deep Learning ist eine Methode des maschinellen Lernens. Dabei wird ein künstliches neuronales Netzwerk eingesetzt, um typische Muster in grossen Datenmengen zu erkennen. Neuronale Netze k?nnen auch Muster und Objekte in Bildern erkennen und generieren, etwa Bilder von Gesichtern oder Interieurs, die t?uschend echt aussehen.
Bilder erkennen – im Kosmos und unter dem Mikroskop
Thomas Hofmann, Professor für Datenanalyse der ETH Zürich und Alexander Refregier vom Institut für Teilchen- und Astrophysik setzen die Methode in ihrem SDSC-Projekt für die Kosmologie ein. Sie wollen zum Beispiel Modellvorhersagen über die Masseverteilung im Kosmos miteinander vergleichen und die Gültigkeit eines wissenschaftlichen Ergebnisses überprüfen. In einem aktuellen Beitrag in Science Astronomy zeigen sie etwa, dass es m?glich ist, mit neuronalen Netzen Bilder des Kosmos zu generieren, die dessen komplexe Strukturen und Muster korrekt darstellen. Methoden des maschinellen Lernens erweitern so das Instrumentarium der Kosmologie und helfen dabei, die Evolution des Universums zu erforschen.
Auf der gleichen Methode basiert das Projekt von Ender Konukoglu, Professor für medizinische Bildverarbeitung an der ETH Zürich, und Anne Bonnin von der Professur für R?ntgenbildgebung der ETH Zürich. Sie untersuchen jedoch nicht Bilder des Universums, sondern mikroskopische Bilder in den Bereichen Medizin und Biologie. Sie erhoffen sich dadurch detailliertere Bildanalysen und ein besseres Verst?ndnis der biologischen Zusammenh?nge.
Nationale Initiative für die Datenwissenschaften
Das Swiss Data Science Center ist ein gemeinsames Projekt von der ETH Lausanne und der ETH Zürich. Es wurde im Januar 2017 gegründet mit dem Ziel, die multidisziplin?re Zusammenarbeit in der Datenwissenschaft zu erm?glichen und gleichzeitig zu f?rdern.
Die Datenwissenschaften geh?ren zu den strategischen Forschungsgebieten des ETH-Bereichs für die Jahre 2017 bis 2020. Seit September 2017 bieten die EPFL und die ETH Zürich Master-Studieng?nge in Datenwissenschaften an, welches zu weiteren Kooperationen mit dem Swiss Data Science Center (SDSC) führen wird.