By Published On: 9. Dezember 2025Categories: Digitalisierung, Inklusion, Kommunikation, Soziales

KI-basierte Gebärdensprachübersetzung – Wo stehen wir?

Die Kommunikationsbarrieren zwischen hörenden und gehörlosen Menschen gehören zu den ältesten und hartnäckigsten Herausforderungen in der inklusiven Gesellschaft. Doch mit den rasanten Fortschritten in der künstlichen Intelligenz eröffnen sich heute neue Wege, diese Barrieren zu überwinden (m-cons 2025).

Während KI-gestütztes maschinelles Schreiben, Übersetzen und Sprechen rasant voranschreiten, bleibt ein zentraler Kommunikationskanal vieler Gehörloser bislang weitgehend unerschlossen: die Gebärdensprache (Pengue und Simone 2025).

Gebärdensprache ist mehr als übersetzte Lautsprache

„Für Menschen, die Gebärdensprache nutzen, sind gesprochene und geschriebene Sprachen in der Regel Fremdsprachen“, erklärt Sarah Ebling, Professorin für Sprache, Technologie und Barrierefreiheit an der Universität Zürich.

Sprach-zu-Text-Tools, die gesprochene Sprache transkribieren, sind für Gehörlose deshalb kaum geeignet. Gebärdensprachen besitzen eine eigene Grammatik, Syntax und räumlich-visuelle Ausdrucksformen – und meist keine standardisierte Schriftform. Eine automatische Übersetzung muss Bewegungen, Mimik, Raumverhältnisse und Tempo interpretieren – und sie anschließend wieder in visuelle Gesten oder verständliche Sprache umwandeln (Pengue und Simone 2025).

KI-Systeme nutzen hierfür komplexe Deep-Learning-Modelle und neuronale Netze, die auf großen, annotierten Datensätzen trainiert sind. Sie erkennen nicht nur die eigentlichen Handzeichen, sondern auch Mimik und Gestik, die für die Bedeutung einer Gebärde entscheidend sind. Aktuelle Forschungsarbeiten zeigen, dass gerade das Einbeziehen dieser subtilen Ausdrucksformen die Erkennungsgenauigkeit und Übersetzungsqualität deutlich erhöht (m-cons 2025).

Technische Hürden und aktuelle Entwicklungen

Ein zentraler Ansatz ist die Kombination bestehender KI-Technologien zu mehrstufigen Dolmetschsystemen, die Gesten erkennen, in Text übersetzen und daraus in Echtzeit ein Video mit einer gebärdenden virtuellen Person generieren.

Viel Aufmerksamkeit erhielt Googles Projekt „SignGemma“. Es verspricht eine automatisierte Übersetzung von gesprochener Sprache in Gebärdensprache – mit Hilfe multimodaler KI-Modelle.

Auch das Zürcher Start-up Sign.mt hat eine erste Demoversion veröffentlicht. Diese ermöglicht bereits Übersetzungen von Text in über 40 verschiedene Gebärdensprachen, darunter Schweizerdeutsch, und erzeugt animierte Avatare, die die Inhalte gebärden (Pengue und Simone 2025).

Vielfältige Einsatzfelder und gesellschaftlicher Nutzen

Öffentliche Einrichtungen, Banken, der Einzelhandel und das Gesundheitswesen profitieren von dieser Technologie, da sie gehörlosen Menschen den Zugang zu wichtigen Lebensbereichen erleichtert. Überall dort, wo menschliche Dolmetscher:innen nicht verfügbar sind, kann KI dazu beitragen, Barrieren abzubauen und Kommunikation zu ermöglichen.

Darüber hinaus fördert die Technologie eine größere Selbstständigkeit im Alltag – etwa bei der Nutzung digitaler Dienstleistungen, im Kundenkontakt oder in Notsituationen, in denen schnelle Verständigung entscheidend ist. So stärkt KI nicht nur die gesellschaftliche Teilhabe, sondern trägt dazu bei, Diskriminierung und soziale Isolation zu verringern (m-cons 2025).

Zudem birgt die KI-gestützten Sprachtechnologie ein enormes Potenzial für Inklusion: etwa beim Erlernen der Gebärdensprache, in Behördengängen, am Arbeitsplatz oder in der Bildung (Dr. Avramidis und Eleftherios) .

Grenzen:

Die Übersetzungen sind oft ungenau und semantisch fehlerhaft.

Die erzeugten Videos wirken steif und wenig ausdrucksstark.

Die Rechenzeit ist zu hoch für Echtzeitkommunikation.

Fehlende Einheitlichkeit der Gebärdensprachen. Weltweit existieren Dutzende Varianten. Für KI-Modelle erschwert das die Entwicklung, da Datenbasis und Trainingsmaterial für kleinere Sprachen nur begrenzt verfügbar sind.

Eine weitere Herausforderung betrifft die Darstellung digitaler Avatare. Zu realistische Figuren wirken oft befremdlich, zu cartoonhafte verlieren an Glaubwürdigkeit (m-cons 2025; Pengue und Simone 2025).

Zwischen Fortschritt und Verantwortung

Die Schweizerische Gehörlosenvereinigung begrüßt die Forschung, mahnt aber zur Vorsicht:

„Die Qualität muss hoch sein, sonst sind diese Tools in der Praxis nicht so zugänglich und nutzbar. Derzeit ist uns kein Produkt bekannt, das unseren Erwartungen genügt.“

Es bedarf einer aktiven Einbindung der Gehörlosen-Community. Da viele Forschende selbst hörend sind, besteht die Gefahr, an den tatsächlichen Bedarfen vorbei zu entwickeln. Probleme entstehen durch Vorurteile in Trainingsdaten, Datenschutzproblemen und einer möglichen sozialen Entfremdung durch technische Vermittlung (Dr. Avramidis und Eleftherios; Pengue und Simone 2025).

Begrenzte Rolle für KI in der Gebärdensprachübersetzung

Trotz rascher Fortschritte sehen viele Fachleute die Einsatzmöglichkeiten künstlicher Intelligenz in der Gebärdensprachkommunikation kritisch. Es wird gewarnt, dass die mangelhafte Qualität KI-generierter Gebärden das Recht gehörloser Menschen auf verständliche Information verletzen und sogar den authentischen Gebärdensprachenkorpus verfälschen könne. Studien zeigen, dass KI-Avatare oft schwer verständlich sind und nur über einen eingeschränkten Wortschatz verfügen (Pengue und Simone 2025).

KI-Systeme seien derzeit nicht in der Lage, menschliche Ausdrucksnuancen, Mimik und emotionale Zwischentöne adäquat zu erfassen – Aspekte, die für erfolgreiche Kommunikation zentral sind (Pengue und Simone 2025).

KI-Avatare sollten nur eingesetzt werden, wenn keine menschlichen Dolmetscher:innen verfügbar sind, etwa bei Routine- oder Informationssendungen.

Die Zukunft liegt in hybriden Modellen, in denen Technik und menschliche Expertise gemeinsam für Zugang, Qualität und Inklusion sorgen (Pengue und Simone 2025).

Fazit: Zwischen Vision und Wirklichkeit

Die Vision einer KI, die Gebärdensprache in Echtzeit dolmetschen kann, steht beispielhaft für die Chancen und Grenzen der digitalen Inklusion.

Die Zukunft dieser Technologien hängt davon ab, ob es gelingt, künstliche Intelligenz mit menschlichem Sprachverständnis, Empathie und kultureller Kompetenz zu verbinden. Erst dann kann KI wirklich barrierefrei werden.

Die Verbindung von Künstlicher Intelligenz und Gebärdensprache ist eine der spannendsten Schnittstellen zwischen Technologie und Inklusion. Noch steht die Entwicklung am Anfang, doch sie birgt das Potenzial, Kommunikation neu zu denken – hin zu einer Gesellschaft, in der Verständigung keine Frage des Hörvermögens mehr ist.

Literaturverzeichnis:

Dr. Avramidis; Eleftherios: KI trifft Gebärdenprache: Wie Technologie barrierefreie Kommunikation ermöglicht.

m-cons (Hg.) (2025): Innovationen in der automatisierten Übersetzung von Gebärdensprache durch moderne KI-Technologien. Online verfügbar unter https://www.m-cons.de/kunstliche-intelligenz-ki-und-gebardensprache-die-zukunft-der-barrierefreien-kommunikation/.

Pengue; Simone (2025): Taugt künstliche Intelligenz für Gebärdensprache? Hg. v. SWI swissinfo.ch. Online verfügbar unter https://www.swissinfo.ch/ger/schweizer-ki/taugt-k%c3%bcnstliche-intelligenz-f%c3%bcr-geb%c3%a4rdensprache/90131119.

Beitragsbildquelle:

Name der Urheberin: Elf-Moondance

Lizenz unter: https://pixabay.com/de/service/license-summary/

Titel: Lehrer, Schule, Zeichensprache. Kostenlose Nutzung.

Link zur Fundstelle: https://pixabay.com/de/illustrations/lehrer-schule-zeichensprache-lernen-7096482/

Teile diesen Artikel