Studie: Künstliche Intelligenz tut sich mit bayrischen Dialekten schwer

    Eine blau-weiße Flagge von Bayern mit Wappen
    Bayern hat viele Dialekte, etwa Ober-, Mittel- und Niederbairisch, auch Fränkisch und Schwäbisch werden in dem Bundesland gesprochen. © picture alliance / galoppfoto / Sabine Brose Sorge
    Beim Dialekt hört die Künstliche Intelligenz auf zu verstehen – das belegt jetzt ein Forschungsprojekt vom Bayerischen Rundfunk und der Ludwig-Maximilians-Universität München. Der Auftrag an die KI lautete, für die in Mundart gesprochenen „Betthupferl“-Sendungen des Senders Transkripte in Hochdeutsch zu erstellen. Getestet wurden unter anderem Fränkisch, Bairisch, Schwäbisch und Oberpfälzisch. Das Resultat: Spracherkennungsprogramme scheitern oft an den Dialekten mit deutlich mehr Fehlern als bei Hochdeutsch - manchmal ging sogar der Sinn verloren. Statt verständlicher Texte ergebe sich oft nur Kauderwelsch, heißt es. Jetzt wird geprüft, ob man die Sprachmodelle besser trainieren kann. Wenn das gelingt, würde dies dem Bayrischen Rundfunk beispielsweise bei der Untertitelung von in Dialekt gesprochenen Sendungen helfen.