Symbolbild:RTR

Das Medienhaus Radiotelevisiun Svizra Rumantscha (RTR), eine SRG-Tochter mit Sitz in Chur, hat zusammen mit dem Walliser Unternehmen Recapp ein Spracherkennungsprojekt zur schriftlichen Wiedergabe von gesprochenem Rätoromanisch gestartet. Um dem Computer überhaupt Rätoromanisch beibringen zu können, hat RTR zunächst Daten beschafft, mit denen das System gefüttert werden konnte. Dazu nutzte das Medienhaus gemäss einer Aussendung die Wörterbücher der Lia Rumantscha (LR) und öffentlich zugängliche Texte wie etwa Zeitungsartikel.

Dabei unterstützte die Abteilung Sprache der LR laut den Infos das Projekt bei sprachspezifischen Fragen. RTR liefert für jedes Idiom und für Rumantsch Grischun jeweils rund 30 Stunden Tonmaterial mit den dazugehörenden Transkriptionen. Diese insgesamt 180 Stunden wurden von RTR, in Zusammenarbeit mit Studierenden der Pädagogischen Hochschule Graubünden, in kleine Segmente portioniert, damit der Text exakt den entsprechenden Audiosequenzen zugeordnet werden konnte.

Mit diesem Material bringen die Spezialisten von Recapp nun dem Computer Rätoromanisch bei. Der Lernprozess des Systems sei dabei ähnlich wie bei Schülern, heisst es: Zuerst müsse der Computer das Alphabet kennenlernen, danach die Wörter, kurze Sätze und später könne er dann alles verstehen.

Bis heute habe der Computer bereits Rumantsch Grischun, Sursilvan und Vallader gelernt. Es werde jedoch deutlich, dass die Lokalkolorite von Tujetsch und Medel über das Lugnez bis hinunter in die Foppa dem Computer die Arbeit nicht leicht machten. Auch für das Vallader (Unterengadin) und die Mundart des Münstertals, das Jauer, sei es schwierig gewesen, das System zu schulen. Diesen Sommer soll nun das Puter (Oberengadin) folgen, und im Jahr 2022 wolle RTR das Projekt mit dem Sutsilvan zum Abschluss bringen. Damit sei das Vorhaben aber nicht einfach zu Ende. Das Rätoromanische – so wie andere Sprachen auch – veränderten sich nämlich stetig und sein Wortschatz werde grösser.

Als technologische Grundlage für die Digitalisierung der rätoromanischen Sprache dient den Angeben zufolge "Speech to text". Dabei handelt es sich um eine automatische und teilweise auch unmittelbare Umsetzung von gesprochener Sprache in einen schriftlichen Text. So werde es in Zukunft möglich sein, Gemeindeversammlungen oder Debatten im Grossen Rat zu transkribieren. RTR habe überdies bereits das Projekt "Text to text" in Angriff genommen. Hier gehe es um die maschinelle Übersetzung von rätoromanischen Texten ins Deutsche. Ohne diese Technologien wäre das Rätoromanische in der digitalen Welt nicht präsent und könnte für Anwendungen wie "voice recognition" oder Google Translate und DeepL nicht verwendet werden, heisst es weiters.

"Speech to text" komme auch in den RTR-Redaktionen zur Anwendung, um die redaktionelle Arbeit zu erleichtern. Durch dessen Integration im Produktionssystem unterstütze es die Journalisten bei der Arbeit. Sie könnten damit Texte transkribieren lassen, um sie dann für Radio- und Videobeiträge aufzubereiten oder sie der Fundaziun Medias Rumantschas (FMR) zur Verfügung zu stellen. Zudem fänden sich im Archiv von RTR zahlreiche alte Sendungen ohne Manuskripte. Dies stelle eine enorme Wortfülle dar, die dank "Speech to text" in eine schriftliche Form gebracht werden kann.



Der Online-Stellenmarkt für ICT Professionals