Zum Hauptinhalt springen

Transkription oder eine Maschine lernt Vorarlbergerisch

Sie möchten die Produktivität Ihres Kundenservice steigern, indem Sie einen Sprachassistenten einführen. Dieser Assistent soll „Mundl“-Wienerisch genauso gut verstehen wie Vorarlbergerisch. In Anbetracht dessen, dass sich nicht einmal Österreicher immer untereinander verstehen, scheint es unmöglich, einer Maschine alle sprachlichen Besonderheiten beizubringen …

Nicht ganz! Eine Möglichkeit, einen Sprachassistenten auf Dialekte zu trainieren, ist, dialektische Sprache ins Hochdeutsche zu transkribieren und ihn daraufhin mit den Transkriptionen zu füttern. Somit weiß die Maschine dann, dass beispielsweise „Oida“ eigentlich „Alter“ heißen soll.

text-it konnte bei einem großangelegten Transkriptionsprojekt für diese Zwecke mitarbeiten und hat dabei so einiges gelernt. Wie man so ein Projekt aufsetzt, die Transkriptionsregeln adaptiert und mit fundierter Revision erfolgreich umsetzt, dafür wurden wir als Sprachprofi mit an Bord geholt.

Die Basis: alltägliches Geplauder

Da jeder Dialekt immens reich ist, braucht es Stunden um Stunden Sprachmaterial, um ihn so umfassend wie möglich kartographieren zu können. Eine Methode, um an besagtes Material zu kommen ist, Menschen beim Telefonieren aufzuzeichnen und sie über Alltägliches plaudern zu lassen. Somit werden Tausende Audiostunden gewonnen, die dann in eine für die Maschine verständliche Form gebracht werden müssen. Hierin liegt die Aufgabe der Transkription.

Aus Dialekt wird Hochdeutsch – aber mit Regeln

text-it bekam das Angebot, an einem großangelegten Transkriptionsprojekt mitzuarbeiten. Prompt wurde uns auch ein 12-seitiges Dokument mit Transkriptionsregeln vorgelegt. Dass „OK“ nur in dieser Form transkribiert werden darf (und nicht als „okay“ oder „ok“) stand da etwa, oder dass ein deutlich hörbares Geräusch (Seufzer, Telefon, Atmen etc.) mit einem gewissen Tag versehen werden muss.

Die Einhaltung und Erweiterung der Regeln ist das A und O jedes Transkriptionsprojekts – denn sie wurden anhand dessen erstellt, was die Maschine bereits versteht. Beispielsweise müssen Ziffern ausgeschrieben werden („eins“ statt „1“). Werden die Regeln nicht eingehalten, kann die Maschine damit nichts anfangen – der Sinn geht verloren, das Audiosegment wird für das Projekt unbrauchbar.

Aber kommen wir zur Praxis

Eine grundlegende Regel in diesem Projekt verlangte, dass Dialektsprache zwar ins Hochdeutsche gebracht werden sollte, aber dennoch Versprecher in den Aufzeichnungen nicht korrigiert werden sollten. Hören Sie sich dieses Beispiel an:

Hörbeispiel 1

Wie würden Sie hier vorgehen? Grammatikalisch richtig wäre natürlich: „Ich habe da eine Frage an Sie.“ Laut den Regeln wäre aber „Ich habe da eine Frage an Ihnen“ richtig. Der Sprecher hat zwar einen „Fehler“ gemacht, darf aber nicht korrigiert werden.

Fällt Ihnen noch etwas auf? Gesprochene Sprache besteht kaum aus ganzen Sätzen. Wir unterbrechen und wiederholen uns und streuen ab und zu ein „äh“ ein.  Wie man Geräusche oder Füller wie „ähm“ oder „mhm“ codiert, hängt natürlich auch von den festgesetzten Regeln ab.

In diesem Fall lautete die korrekte Transkriptionsvariante:

Ja, also #äh guten Tag erstmal, ich #ähm [schmatzen] habe da eine Frage #äh an Ihnen, ich wurde nämlich #äh bedroht

Im Laufe des Projekts stand aber schnell fest: Auch der umfangreichste Regelkatalog beseitigt nicht Unklarheiten, wie die folgenden zwei Hörbeispiele illustrieren.

Hörbeispiel 2

Die Sprecherin sagt „beraten la“, was „beraten lassen“ bedeutet. Wir wissen, was sie meint, auch wenn sie es nicht sagt. Laut den Regeln durften wir den Sprechern nichts in den Mund legen, aber in diesem Fall ist die hochdeutsche Variante richtig, da die Sprecherin im Gegenzug zum ersten Hörbeispiel grammatikalisch richtig spricht, nur eben dialektisiert.

In diesem Fall lautete die korrekte Transkriptionsvariante:

[atmen] Ja hallo, #ähm [atmen] ich rufe an zum #äh [atmen] mich ein klein von Ihnen beraten lassen. Sie haben ja #öhm [atmen]

Hörbeispiel 3

Im dritten Hörbeispiel greifen wir uns das Wort „lugen“ heraus, was laut Duden etwa „spähen“ bedeutet. Die Sprecherin braucht es aber ganz einfach synonym für „schauen“. Hier musste Rücksprache mit dem Kunden gehalten werden, was schließlich in der Anweisung endete, „lugen“ als solches zu transkribieren. Man berief sich auf die Regel, dass auch "ungewöhnliche" Sprache transkribiert werden sollte.

In diesem Fall lautete die korrekte Transkriptionsvariante:

Genau, das ist auch gar kein Problem, das machen wir auf jeden Fall ganz gerne, wenn Sie ins Geschäft kommen, da müssen Sie auch gar keinen Termin ausmachen oder so, also einfach hineinkommen [atmen] und lugen wer grad ausschaut, als hätte er Zeit und den einfach fragen

Grundsätzlich galt das, was immer gilt: im Zweifelsfall nachfragen! Von Projektanfang bis -ende mussten viele Einzelfälle extra abgeklärt werden, was deutlich machte, dass gesprochene Sprache sich nicht so einfach codieren lässt. Die Transkription ist aber eine Methode, sich diesem Ideal zu nähern.

Lektionen für uns – Mehrwert für Sie

Mit diesem Projekt hat text-it weitere und vertiefende Kenntnisse im Bereich Transkription gewonnen. Für Ihr Transkriptionsprojekt stimmen wir die Regeln mit Ihren Anforderungen ab. Je nach Anforderung setzen wir automatisierte Transkriptionslösungen ein oder fertigen die Transkriptionen manuell an. Aus unserem 4-Augen-Prinzip wird ein 4-Ohren-Prinzip, denn nur mit einem Review können Sie die gewonnen Daten validieren.

Um Ihnen ein Angebot zu erstellen, brauchen wir folgende Informationen von Ihnen: 

  • Wie liegt das Audiomaterial vor?
  • Wie viele Minuten/Stunden Audiomaterial sollen transkribiert werden?
  • Wofür erfolgt die Transkription?
  • Wie genau soll die Transkription sein?
  • Welches Dateiformat benötigen Sie?

Stand: 2021