Symbolbild: Picswiss

Die beiden einzigen helvetischen Anbieter von professionellen Sprachlösungen in Schweizerdeutsch, Spitch und Recapp IT, haben eine Zusammenarbeit beschlossen, um die Standardisierung des Schweizerdeutschen für die Entwicklung von Spracherkennungslösungen gemeinsam voranzutreiben. Dies garantiere den heutigen und zukünftigen NLU-Anwendern, dass die Ergebnisse einer solchen Datenaufbereitung weiterhin transparent und wiederverwendbar seien. Sobald erste Ergebnisse dieser Zusammenarbeit vorlägen, sollen unter www.transkriptionstandard.ch der Öffentlichkeit zugänglich gemacht werden, heisst es.

Hintergrund dazu ist, dass die extremen regionalen Dialektausprägungen, vom breitesten "Wallisserditsch" bis hin zum Freiburger Senseler Dialekt, der automatischen Verarbeitung von Sprache, zum Beispiel beim Transkribieren, stark hinderlich seien. Die Aufwendungen, um in Schweizerdeutsch gehaltene Gespräche, Vorträge, Sitzungen usw. in Protokolle und Transkripte in Hochdeutsch zu überführen, seien enorm. Während es längst möglich sei, in einer standardisierten Sprache, zum Beispiel in Englisch oder Hochdeutsch vorliegende Gespräche schnell und kostengünstig maschinell zu transkribieren, gehe dies bei "Schwiizerdütsch" kaum. Die Komplexität des Schweizerdeutschen sei der Hauptgrund, dass es für die bei der Spracherkennung wichtigen Annotierungen noch keine Standards gebe.

Als erster Schritt haben Spitch und Recapp IT nun entschieden, gemeinsam einen "CH Basis-Standard für die Transkribierung (Annotierung) von Schweizerdeutsch zu entwickeln". Gerade die "Annotierung" sei bei der Entwicklung von Spracherkennungslösungen ein wichtiger und kostspieliger Faktor, heisst es dazu. Für die Annotierung müssten die gesprochenen Audio-Daten manuell von Linguisten (die Schweizerdeutsch sprechen) transkribiert werden, was hohe Kosten nach sich ziehe. Der neue Transkriptionsstandard von Spitch und Recapp IT soll daher helfen, die Annotierungskosten zu verringern und die Austauschbarkeit der Daten zu erhöhen. Zudem soll auch der Aufwand, um neue Annotierer auszubilden oder zu finden sowie die Datenaufbereitung in der Zukunft geringer ausfallen, da bereits heute bestehende Plattformen und Tools dieser Firmen vorhanden seien, welche diesen Standard - und andere Sprachen - unterstützen und von der Community bereits genutzt würden.

Zurzeit arbeiten die beiden Firmen an der Definition des Standards. In einer nächsten Phase werden dann auch weitere Schweizer Unternehmen eingeladen, sich an der Entwicklung zu beteiligen. Interessierte können sich bereits heute unter transkriptionsstandard.ch registrieren.