Ein Mikrofon mit der Aufschrift "RTR" liegt auf einem Tisch.
SRG Deutschschweiz News

Spracherkennung: RTR bringt dem System Rätoromanisch bei

«Speech to text» ist für Sprachen wie Deutsch, Italienisch oder Französisch nichts Neues – für das Rätoromanische hingegen schon. Jetzt soll der Computer lernen, auch Rätoromanisch zu verstehen und zu schreiben.

Das rätoromanische Medienhaus Radiotelevisiun Svizra Rumantscha (RTR) hat gemeinsam mit der Walliser Firma recapp ein Projekt für die schriftliche Wiedergabe von gesprochenem Rätoromanisch lanciert.

«Speech to text» ist eine automatische und teilweise auch unmittelbare Umsetzung von gesprochener Sprache in einen schriftlichen Text. Dabei spricht man von der direkten Variante, d.h. der Computer schreibt unmittelbar, was die eine Person spricht – und von der indirekten, bei welcher der Computer zuerst das Gesprochene analysiert und es erst danach in eine schriftliche Form bringt.

Um dem Computer überhaupt Rätoromanisch beibringen zu können, hat RTR zunächst Daten beschafft, mit denen das System gefüttert werden konnte. Dazu nutzte das Medienhaus die Wörterbücher der Lia Rumantscha (LR) und öffentlich zugängliche Texte wie etwa Zeitungsartikel. Die Abteilung Sprache der LR unterstützte das Projekt bei sprachspezifischen Fragen. RTR liefert für jedes Idiom und für Rumantsch Grischun jeweils rund 30 Stunden Tonmaterial mit den dazugehörenden Transkriptionen. Diese insgesamt 180 Stunden wurden von RTR, in Zusammenarbeit mit Studierenden der Pädagogischen Hochschule Graubünden, in kleine Segmente portioniert, damit der Text exakt den entsprechenden Audiosequenzen zugeordnet werden konnte. Mit diesem Material bringen die Spezialistinnen und Spezialisten von recapp nun dem Computer Rätoromanisch bei. Der Lernprozess des Systems ist dabei ähnlich wie bei einer Schülerin oder einem Schüler: Zuerst muss der Computer das Alphabet kennenlernen, danach die Wörter, kurze Sätze und später kann er dann alles verstehen.

Rumantsch Grischun, Sursilvan und Vallader bereits in Gebrauch

Bis heute hat der Computer bereits Rumantsch Grischun, Sursilvan und Vallader gelernt. Es wird jedoch deutlich, dass die Lokalkolorite von Tujetsch und Medel über das Lugnez bis hinunter in die Foppa dem Computer die Arbeit nicht leicht machen. Auch für das Vallader (Unterengadin) und die Mundart des Münstertals – das Jauer – war es schwierig, das System zu schulen. Diesen Sommer folgt das Puter (Oberengadin) und im Jahr 2022 wird RTR das Projekt mit dem Sutsilvan zum Abschluss bringen. Damit ist das Vorhaben aber nicht einfach zu Ende. Das Rätoromanische – so wie andere Sprachen auch – verändert sich stetig und sein Wortschatz wird grösser.

«Speech to text» ist die technologische Grundlage für die Digitalisierung der rätoromanischen Sprache. So wird es in Zukunft möglich sein, Gemeindeversammlungen oder Debatten im Grossen Rat zu transkribieren. RTR hat überdies bereits das Projekt «Text to text» in Angriff genommen. Hier geht es um die maschinelle Übersetzung von rätoromanischen Texten ins Deutsche. Ohne diese Technologien ist das Rätoromanische in der digitalen Welt nicht präsent und kann für Anwendungen wie «voice recognition» oder Google Translate und DeepL nicht verwendet werden.

«Speech to text» kommt in den RTR-Redaktionen zur Anwendung, um die redaktionelle Arbeit zu erleichtern. Durch dessen Integration im Produktionssystem unterstützt es die Journalistinnen und Journalisten bei der Arbeit. Sie können Texte transkribieren lassen, um sie dann für Radio- und Videobeiträge aufzubereiten oder sie der Fundaziun Medias Rumantschas (FMR) zur Verfügung zu stellen. Zudem finden sich im Archiv von RTR zahlreiche alte Sendungen ohne Manuskripte. Dies stellt eine enorme Wortfülle dar, die dank «Speech to text» in eine schriftliche Form gebracht werden kann.


Text: RTR

Bild: RTR

Diese Beiträge könnten Sie auch interessieren:

Bild von BNJ Suisse SA verzichtet auf den Kauf von Radio Swiss Pop

BNJ Suisse SA verzichtet auf den Kauf von Radio Swiss Pop

Ende Februar 2020 hat die Westschweizer Firma BNJ Suisse SA den SRG-Spartensender Radio Swiss Pop gekauft. Angesichts der schlechten Aussichten auf dem Werbemarkt verzichtet BNJ auf den Kauf. Die SRG wird Radio Swiss Pop weiter selbst betreiben.

Weiterlesen

Bild von Eine digitale Reise durch die Geschichte der SRG

Eine digitale Reise durch die Geschichte der SRG

Die SRG wurde vor bald 90 Jahren als Schweizerische Rundspruchgesellschaft gegründet. Seither hat sie viele Veränderungen erfahren und zahlreiche Herausforderungen gemeistert. Diese Etappen wurden neu in der «Chronik der SRG» zusammengestellt.

Weiterlesen

Bild von Schwingsport bis 2028 bei der SRG

Schwingsport bis 2028 bei der SRG

Die SRG und der Eidgenössische Schwingerverband (ESV) haben ihre Vertragspartnerschaft um weitere sechs Jahre verlängert. Somit können SRF, RTS, RSI und RTR mindestens bis 2028 umfassend und live über alle Schwingsportanlässe berichten.

Weiterlesen

Teilen Sie uns Ihre Meinung mit (bitte beachten Sie die Netiquette/AGBs)

Lade Kommentare...
Noch keine Kommentare vorhanden

Leider konnte dein Kommentar nicht verarbeitet werden. Bitte versuche es später nochmals.

Ihr Kommentar wurde erfolgreich gespeichert und wird nach der Freigabe durch SRG Deutschschweiz hier veröffentlicht