Sprachdaten essenziell

Lia Rumantscha plant rätoromanisches LLM

Uhr
von Filip Sinjakovic und jor

Der Sprachverband Lia Rumantscha plant die Entwicklung rätoromanischer KI-Sprachmodelle. Damit soll das Rätoromanische im digitalen Raum präsenter gemacht und der alltägliche Sprachgebrauch erleichtert werden. Eine entsprechende Strategie veröffentlichte der Verband auf seiner Website.

(Source: fhgr.ch)
(Source: fhgr.ch)

Lia Rumantscha, der Dachverband aller romanischen Sprachvereine, will das Rätoromanische im digitalen Raum präsenter machen. Das kündigt der Verband in einem am 3. März auf seiner Website veröffentlichten Projektentwurf an. Im Vordergrund stehe dabei, den Sprachgebrauch im Alltag zu vereinfachen.

Bedarf nach rätoromanischen KI-Anwendungen

Die Ergebnisse einer Umfrage in den 30 Gemeinden des rätoromanischen Sprachgebietes hätten ergeben, dass ein lokaler Bedarf nach digitalen Hilfsmitteln wie Übersetzungsprogrammen oder Schreibassistenten bestehe. Zudem seien die Gemeinden auch bereit, bei der Entwicklung von entsprechender Software ihre Datenbestände zur Verfügung stellen, berichtet "Inside IT".

Lia Rumantscha erachtet vor allem die Akquisition von Sprachdaten als essenziell für die Entwicklung eines rätoromanischen Large-Language-Models (LLM). Die Archive des Fernsehsenders Radiotelevisiun Svizra Rumantscha, der Nachrichtenagentur Fundaziun Medias Rumantschas und der Engadiner Post sollen dabei als Datenquellen fungieren, wie es weiter heisst.

Beteiligung der FH Graubünden

Das Institut für Computerlinguistik der Universität Zürich und die Fachhochschule Graubünden sind ebenfalls an der Entwicklung des LLM beteiligt. Letztere stellte bereits im Februar 2022 die prototypische Übersetzungssoftware "Translatur-ia" vor, die in Zusammenarbeit mit Lia Rumantscha entwickelt wurde. Des Weiteren soll die Integration des Rätoromanischen in internationale Standards wie etwa Unicode gefördert werden. Dies soll die Entwicklung von rätoromanischen Bedienoberflächen für häufig verwendete Software vorantreiben. 

Die Koordination des Projekts und der beteiligten Partner unterliege Lia Rumantscha. Hierfür ist der Verband nun Mitglied in wirtschaftlichen und wissenschaftlichen Netzwerken wie SwissNLP und Clarin-CH, um vom Wissen der anderen Sprachregionen zu profitieren.

 

Der Schweizer Sprachdienstleister Supertext lancierte im Februar eine neue Übersetzungsplattform, die KI-Übersetzungen mit Prüfungen durch Experten kombiniert. In einem internen Vergleich schnitt das System in drei von vier Sprachkombinationen besser ab als das deutsche LLM Deepl. Lesen Sie hier mehr darüber.

Webcode
SKeUukPT