UZH-Alumna und Computerlinguistin Sarah Ebling arbeitet an einer App, die simultan Laut- in Gebärdensprache übersetzt. Mit ihrer Forschung möchte sie Menschen mit Behinderung den Zugang zur digitalen, aber auch zur physischen Welt erleichtern. Ein Gespräch über digitale Barrieren und Lösungen.

Foto Sarah Ebling

Werden Personen mit einer Behinderung, z.B. Blinde oder Gehörlose, durch die zunehmende Digitalisierung eher ein- oder ausgeschlossen? 

Die zunehmende Digitalität im Alltag hat zu neuen Barrieren für Menschen mit einer Behinderung geführt: Die Bedienung von Geräten mit Touchscreens beispielsweise ist schwierig für blinde Menschen. Und die Teilnahme an virtuellen Konferenzen ist für Menschen mit Behinderung eine grosse Herausforderung: So war bei den gängigen Videokonferenzapplikationen die Erkennung von Gebärdenaktivität lange Zeit nicht implementiert und Gebärdende wurden nicht als «Sprecher» erkannt. Erst im Zuge der Corona-Pandemie und der Häufung von Videokonferenzen wurden Lösungen entwickelt, um barrierefreie Tagungen z.B. mit Untertitelungen für Menschen mit einer Hörbehinderung, mit Audiodeskription für Blinde oder Textvereinfachung für Menschen mit kognitiven Beeinträchtigungen zu ermöglichen. 

Gleichzeitig bringt die Digitalisierung aber auch neue Chancen und Möglichkeiten der Zugänglichkeit, so zum Beispiel die Generierung von Alternativtexten für Bilder durch Image Captioning, mit dem blinde Menschen in Kontakt kommen, wenn sie die Inhalte einer Website über einen Screen Reader empfangen. 

Sie entwickeln digitale Tools, die Lautsprache in Gebärdensprache übersetzen. Wie sind Sie zu diesem Thema gekommen?

Durch ein rein linguistisches Interesse. Ich wollte eine Sprache lernen, die sich in einer anderen Modalität abspielt als unsere Lautsprachen, in der visuell-gestischen Modalität. Dabei habe ich erkannt, dass sich sehr viele spannende Forschungsfragen ergeben, gerade in meinem Bereich der Computerlinguistik. Mit den Methoden des maschinellen Lernens, z.B. neuronale Netze, lassen sich gute Beiträge leisten.

Mit meiner Forschung möchte ich Menschen mit Behinderung den Zugang zur digitalen, aber auch zur physischen Welt erleichtern. Konkret arbeite ich unter anderem bei einem EU-Projekt an der Entwicklung einer App mit, die Lautsprache in Gebärdensprache und umgekehrt simultan übersetzt. 

Wie funktioniert eine solche App? 

Dazu braucht es ein Zusammenspiel von drei Komponenten: der Gebärdenspracherkennung zum Beispiel über eine Kamera oder der (Laut-)Spracherkennung, der Gebärdensprachübersetzung, denn Gebärden sind eine eigene Sprache mit eigener Grammatik und eigenem Lexikon, und der Synthese auf der Ausgabeseite in Form von Text, gesprochener Sprache oder Gebärden mit einem Avatar. Bei der Gebärdensprache übertragen nicht nur die Hände Bedeutung, sondern die Mimik und der ganze Oberkörper können kernlinguistische Funktionen haben. Diese Bereiche in einem Modell abzubilden ist sehr anspruchsvoll und darum sehr spannend. An den einzelnen Komponenten haben wir schon gearbeitet, nun geht es ans Zusammenbringen, das ist neu.

Weshalb ist eine Gebärdensprache-Übersetzung besser als eine Schriftlösung?

Gehörlosen Menschen die Informationen in Schriftsprache anzubieten, greift zu kurz. Durch ihre Gehörlosigkeit ist der Erwerb von Schriftsprache für sie enorm schwierig. Die umgebende Lautsprache, ob als Schrift- oder gesprochene Sprache realisiert, ist für sie eine Fremdsprache. Der Anspruch auf Gebärdensprache ist also nicht nur ein politisches Postulat, sondern eine linguistische Notwendigkeit. 

Was ist Ihre Vision?

In Bezug auf die Gebärdensprach-Technologie sicher, dass wir eine Erleichterung für Gebärdensprach-Benutzende bringen können. Im grösseren Kontext sollte es unser Ziel sein, digitale Technologien von Anfang an möglichst barrierefrei zu konzipieren. Dabei spielt die «leichte Sprache» eine wichtige Rolle. Der Bund hat das erkannt und stellt Informationen auf seinen Websites zunehmend auch in Gebärdensprache und leichter Sprache bereit. Die leichte Sprache richtet sich nicht nur, aber vor allem an Menschen mit kognitiven Beeinträchtigungen. Letztendlich profitieren wir alle davon, wenn Formulare oder beispielsweise Abstimmungsunterlagen leichter verständlich sind.

Welche Bedeutung hat der interdisziplinäre Austausch mit Forschenden, wie er im Rahmen der Digital Society Initiative (DSI) an der UZH geschieht?

Von der DSI geht eine Signalwirkung aus: Der Stellenwert der interdisziplinären Forschung ist gestiegen und die DSI bietet Forschenden wie mir, die immer schon interdisziplinär gearbeitet haben, eine Heimat und eine konkrete Plattform für den Austausch. Einerseits durch Veranstaltungen und andererseits durch die Fellowships, bei denen man eine gewissen Anzahl Tage vor Ort verbringt. Neue Ideen entstehen dann, wenn man zusammenkommt. Damit man sich über die verschiedenen Disziplinen hinweg versteht, braucht es Zeit. Danach ist die Zusammenarbeit aber enorm fruchtbar und man kann etwas auf die Beine stellen, das mehr ist als die Summe der Einzelteile. Die DSI bietet das Gefäss dafür.


Sarah Ebling

Studienabschlüsse: lic. phil. UZH in Deutscher Sprach- und Literaturwissenschaft 2011, Dr. phil. UZH in Computerlinguistik 2016
Tätigkeit: Senior Researcher am Institut für Computerlinguistik der UZH, Leitung Forschungsgruppe «Langauge Technology for Accessibility»


Innosuisse Flagship-Projekt

Die schweizerische Agentur für Innovationsförderung (Innosuisse) hat das vierjährige Flagship-Projekt «Inclusive Information and Communication Technologies» (IICT) unter der Leitung von Sarah Ebling und der UZH zur Überwindung von Kommunikationsbarrieren für eine bessere soziale Inklusion gefördert (Gesamtvolumen: 12.4 Mio CHF). 
Weitere Informationen


Anna-Julia Lingg, UZH Alumni

Andere Neuigkeiten