Startseite
Eine Machine-Learning-Modellfamilie zur Transkription der in Südtirol gesprochenen deutschen Dialekte ins Standarddeutsch.
Südtirolerisch ist ein bairischer Dialekt, der in der nördlichsten Provinz Italiens, Südtirol, gesprochen wird. Er vereint germanische und romanische Elemente und wird hauptsächlich mündlich verwendet, ohne standardisierte Rechtschreibung. Der Dialekt wird generationsübergreifend häufig zur informellen Kommunikation genutzt und steht im Kontrast zur standardsprachlichen Varietät des Deutschen, die in formellen Kontexten in Südtirol verwendet wird.
Augusta wird am Institut für Angewandte Sprachforschung der Eurac Research entwickelt, um der lokalen Nachfrage gerecht zu werden.
Anwendungen
Augusta unterstützt unterschiedliche Anwendungsszenarien rund um die automatische Transkription von gesprochenem Südtiroler Deutsch ins Standarddeutsche. Der Fokus liegt dabei auf realen Einsatzkontexten aus Forschung, Medien und Archivierung.
Forschungsinterviews
Augusta transkribiert qualitative Forschungsinterviews und unterstützt so die textbasierte Analyse gesprochener Daten.
Der Einsatz ist insbesondere für sozial‑, sprach‑ und kulturwissenschaftliche Forschungskontexte konzipiert, in denen Dialektaufnahmen eine zentrale Rolle spielen.
Meetings und informelle Gespräche
Augusta eignet sich zur Transkription informeller Besprechungen und Gespräche, bei denen Dialekt gesprochen wird.
So wird mündliche Kommunikation nachhaltig dokumentiert und leichter zugänglich gemacht.
Film und audiovisuelle Medien
Augusta ermöglicht die automatische Transkription gesprochener Inhalte aus Filmen, audiovisuellen Produktionen sowie historischen Audioaufnahmen.
Dies bildet eine Grundlage für die Erstellung von Untertiteln, die inhaltliche Erschließung medialer Bestände und die Durchsuchbarkeit sprach‑ und kulturhistorisch wertvoller Archive.
Zugriffsmöglichkeiten
-
Rohmodelle
Direkter Zugriff auf die trainierten ASR‑Modelle von Augusta zur lokalen Nutzung, Weiterentwicklung oder Integration in eigene Workflows.
Die Modelle werden über unser GitLab‑Repository bereitgestellt und eignen sich insbesondere für Forschungs‑ und Entwicklungszwecke. -
API
Programmierschnittstelle zur automatisierten Transkription von Audiodaten mit Augusta, z. B. zur Einbindung in bestehende Anwendungen oder Datenpipelines.
Der API‑Zugang befindet sich derzeit noch in der Entwicklung.
-
Webanwendung
Benutzerfreundliche Weboberfläche zur direkten Transkription von Audiodateien mit Augusta – ohne lokale Installation und mit Fokus auf einfache Bedienbarkeit.
Die Webanwendung befindet sich derzeit noch in der Entwicklung.