Symbolbild: Pixabay/The Digital Artist

Komplexe Bioinformatikdatenbanken bergen enormes Wissen, das aber nur mit technischem Know-how abgefragt werden kann. Schweizer Wissenschaftler habe mit "Biosoda" ein Projekt durchgefüht, das zum Ziel hatte, eine intuitive, Google-ähnliche Suchfunktion zu entwickeln, die helfen soll, neue Zusammenhänge in den gespeicherten Daten zu erkennen.

Vor dem Start des Biosoda-Projekts mussten Endanwender für den Zugriff auf die grossen Bioinformatik-Datenbanken die Abfragesprache "SPARQL" beherrschen und die zugrundeliegende Struktur der Datenbanken kennen. Da die meisten nicht über ausreichende Kenntnisse verfügten, konnten sie die Unmengen von Informationsquellen nicht effektiv abfragen oder benötigten die Hilfe einiger weniger Fachleute, um auf ihre Daten zuzugreifen. Dieser Prozess war sowohl zeitaufwendig als auch ineffizient, da Forschende ihre kostbare Zeit in die Datensuche investierten, anstatt wissenschaftliche Forschung zu betreiben.

Mit Biosoda wurde nun der Grundstein für die Anwendung des entwickelten Systems und des Forschungsansatzes weit über die Biowissenschaften hinausgelegt. So wird Biosoda heute auch im Projekt "Inode" (Intelligent Open Data Exploration, www.inode-project.eu) eingesetzt, gefördert vom Programm "Horizon 2020" der Europäischen Union. Das Ziel von Biosoda in Inode ist es, datensatzübergreifende Abfragen in natürlicher Sprache aus drei wissenschaftlichen Domänen zu ermöglichen: Krebs-Biomarker-Forschung, Forschungs- und Innovationspolitik sowie Astrophysik.

Die Aufgabe dieses Projekts ist vergleichbar mit der Übersetzung von einer Sprache in eine andere. Unter Verwendung dieser Analogie kann man die Sprachen, die für die Abfrage von Bioinformatikdaten benutzt werden, mit Esperanto und Latein vergleichen. Werden diese Sprachen nicht oder nur schlecht beherrscht, lassen sich nur beschränkte biowissenschaftliche Erkenntnisse gewinnen, da die Kommunikation mit dem System harzt. Biosoda (Search Over Data Warehouse for Biology) soll intuitive Suchbegriffe in komplexe Suchanfragen der Datenbanken umwandeln.

Hintergrund zu Bisoda ist, dass die rasanten Fortschritte in der DNA-Sequenzierung die Biowissenschaften zu einer sehr datenintensiven Disziplin machen. Unmengen an Bioinformatikdaten sind in komplexen Datenbanken gespeichert, die zwar auf mächtigen Technologien beruhen, doch für Abfragen viel Hintergrundwissen in Informatik benötigen. Für die effiziente Analyse von Dutzenden von Bioinformatikdatenbanken werden neue Suchtechnologien benötigt.

Projektverantwortliche sind Prof. Kurt Stockinger (Zürcher Hochschule für Angewandte Wissenschaften (ZHAW), Winterthur), Maria Anisimova ZHAW & SIB, Wädenswil, Heinz Stockinger (SIB Swiss Institute of Bioinformatics, Lausanne), Prof. Marc Robinson-Rechavi (Département d'Ecologie et d'Evolution, Faculté de Biologie et de Médecine, Université de Lausanne & SIB) und Prof. Christophe (Dessimoz, Département d'Ecologie et d'Evolution, Faculté de Biologie et de Médecine, Université de Lausanne & SIB).