Startseite
Eine KI-Modellfamilie zur Transkription der in Südtirol gesprochenen deutschen Dialekte ins Standarddeutsch.
Südtirolerisch ist ein bairischer Dialekt, der in der nördlichsten Provinz Italiens, Südtirol, gesprochen wird. Er vereint germanische und romanische Elemente und wird hauptsächlich mündlich verwendet, ohne standardisierte Rechtschreibung. Der Dialekt wird generationsübergreifend häufig zur informellen Kommunikation genutzt und steht im Kontrast zur standardsprachlichen Varietät des Deutschen, die in formellen Kontexten in Südtirol verwendet wird.
Augusta wird am Institut für Angewandte Sprachforschung der Eurac Research entwickelt, um der lokalen Nachfrage gerecht zu werden.
Anwendungen
-
Interviews
Transkribiert Forschungsinterviews in Textform für die qualitative Analyse.
-
Film
Wandelt gesprochene Dialoge in Filmen in präzise Transkripte für Untertitel um.
-
Meetings
Erfasst und transkribiert informelle gesprochene Inhalte aus Besprechungen für eine einfache Dokumentation.
-
Audio-Archive
Macht historische Audioaufnahmen durch Transkription in durchsuchbaren Text zugänglich.