31. Oktober 2016

Coffee Break: Im Gespräch mit Dr. Martin Kappus

Begriffe wie «Computerlinguistik» und «Sprachtechnologie» kommen in der Sprachdienstleistungsbranche immer öfter vor. Was aber ist darunter zu verstehen? Und inwiefern haben diese mit der Arbeit von Übersetzern und Sprachspezialisten zu tun? Dr. Martin Kappus, Dozent an der Zürcher Hochschule für Angewandte Wissenschaften, verrät in diesem Interview, was es mit den beiden Begriffen auf sich hat und wie Übersetzer davon profitieren können.

Die Verbindung von «Computer» und «Linguistik» war schon immer Martins Leidenschaft. In den 90er Jahren fing er mit einem Studium im Bereich Computerlinguistik an, wechselte dann jedoch zur klassischen Linguistik, die im Vergleich sprach- und übersetzungsorientierter war. Sein anhaltendes Interesse für Computer und EDV brachte ihn nach seiner Promotion dazu, eine Stelle bei einem grossen CAT-Tool-Hersteller anzunehmen, wo er für Support, Schulung und Beratung verantwortlich war. Danach wechselte er zu einem Schweizer Sprachdienstleister und konzentrierte sich mehrheitlich auf den Bereich der sprachtechnologischen Beratung. Seit 2010 ist Martin Dozent an der ZHAW, wo er seit 2014 zusammen mit Professor Susanne Jekat die Sektion Computerlinguistik der Gesellschaft für Angewandte Linguistik leitet.

Martin, was muss man sich unter «Computerlinguistik» und «Sprachtechnologie» vorstellen?

Die Computerlinguistik ist eine junge Wissenschaft, die oft als das Bindeglied zwischen Linguistik und Informatik definiert wird. Sie ist ziemlich vielfältig und reicht von sehr theoretischen Ansätzen zur Erforschung der Informations- und Sprachverarbeitung bis hin zur praktischen Anwendung. Die Sprachtechnologie hingegen kann als «Ergebnis» der computerlinguistischen Forschung betrachtet werden, die sich in Bereichen wie maschinelle Übersetzungssysteme, Spracherkennung und Sprachgenerierung manifestiert.

Das heisst also, dass für Übersetzer vor allem die Sprachtechnologie interessant ist?

Genau. CAT-Tools etwa sind die sprachtechnologischen Anwendungen, die bei Übersetzern am meisten Verwendung finden. Diese basieren auf computerlinguistischen Mechanismen. Im Übersetzungsbereich gibt es aber weitaus mehr sprachtechnologische Werkzeuge, die für Übersetzer sehr nützlich sein können.

Zum Beispiel?

Ich denke da an Spracherkennungssoftware oder Diktiersysteme, die heute bei vielen Übersetzern im Einsatz sind. Aber auch Data- und Textminingprogramme gewinnen immer mehr an Bedeutung, und selbstverständlich auch die maschinelle Übersetzung oder MÜ. Angrenzende Bereiche wie die barrierefreie Kommunikation sind ebenfalls erwähnenswert – übrigens ein Gebiet, das sich für Übersetzer immer mehr aufschliesst.

Diese Aufzählung könnte jetzt aber auch abschreckend wirken...

(Lacht) Ja, vielleicht. Dennoch ist es gerade für Übersetzer äusserst wichtig, sich mal vertieft mit diesen Themen auseinanderzusetzen.

Weshalb?

Die Antwort liegt auf der Hand: Weil sich durch sprachtechnologisches Wissen unnötiger Aufwand vermeiden lässt und Übersetzer dadurch deutlich effizienter arbeiten können.

Es ist also nicht genug, wenn man als Übersetzer schon mit CAT-Tools arbeitet?

Das hängt ganz davon ab, wie ein Übersetzer damit arbeitet. Es kommt nicht selten vor, dass CAT-Tool-Anwender nur einen Bruchteil der Funktionalitäten ihrer Software kennen oder nicht in der Lage sind, diese zielgerichtet zu nutzen. Meinen Studierenden sage ich z. B. oft, dass es sich lohnt, unter die Haube zu schauen und die Funktionsweise des Motors zu kennen.

Einige Übersetzer könnten da aber vielleicht einwenden, dass es doch reicht, das Auto fahren zu können, ohne zwangsläufig eine Ausbildung als Mechaniker absolvieren zu müssen...

(Lacht) Ich meine natürlich nicht, dass man den Motor auseinandernehmen oder zusammenbauen können muss – aber es wäre doch durchaus vorteilhaft zu wissen, wo das Knöpfchen für eine bessere Strassenbeleuchtung oder für die einfachere Steuerung des Autos ist. Es geht darum, in der Lage zu sein, bestimmte Probleme selber zu lösen, damit man schneller und ohne Unfälle von A nach B kommt.

Was sind das für Probleme?

Das kommt ganz auf das Einsatzgebiet oder die Aufgabe an. Nehmen wir z. B. die Dateiaufbereitung. Was, wenn der Kunde plötzlich das Dateiformat ändert und der Übersetzer nicht in der Lage ist, den zu übersetzenden Text von übrigen textuellen Elementen zu trennen? Das kommt oft bei xml- oder html-Dateien vor. Wenn man aber weiss, wie das jeweilige System für die Übersetzung solcher Dateien zu konfigurieren ist, kann man sich viel Zeit sparen und auch in Zukunft von dieser Automatisierung profitieren. (Denkt nach) Ich will es mal so ausdrücken: Sprachtechnologische Anwendungen sind Werkzeuge, und je mehr man über diese Werkzeuge weiss, desto effizienter kann man diese einsetzen.

Und doch gibt es immer noch viele Sprachdienstleister, die ohne Sprachtechnologie auskommen…

Das stimmt. Gerade deswegen würde ich diesen Sprachdienstleistern empfehlen, sich bei Gelegenheit mit der Materie auseinanderzusetzen. Dafür gibt es drei gute Gründe. Erstens entwickelt sich der Trend immer stärker in Richtung Automatisierung und computerunterstützte Sprachadaption. Das bedeutet gleichzeitig, dass immer mehr computergestützte Anwendungen eingesetzt und weiterentwickelt werden. Folglich ist es als Sprachdienstleister unheimlich wichtig, diesen «Zug» nicht zu verpassen. Zweitens: Ich wiederhole mich zwar, aber die Effizienz, die durch die Anwendung von Sprachtechnologie erreicht wird, ist indiskutabel und mittlerweile praktisch undenkbar. Ich kenne keinen Übersetzer, der etwas dagegen hätte, durch die richtigen Tools seine Produktivität und die Qualität seiner Texte zu steigern. Der dritte, aber nicht weniger wichtige Grund, ist die Flexibilität gegenüber den Kunden.

Was meinst du damit?

Man darf nicht vergessen, dass die Software-Hersteller und damit sprachtechnologische Entwicklungen sich vor allem an den Bedürfnissen bestehender Kunden orientieren. In anderen Worten: Neue Features entstehen fast immer deshalb, weil diese von einem oder mehreren Kunden benötigt werden. Wenn ein Sprachdienstleister sowohl diese Bedürfnisse als auch diese Features kennt, kann er seine Kunden nicht nur besser bedienen, sondern auch optimal beraten – und sich somit von der Konkurrenz abheben, was sich wiederum auf die Kundengewinnung positiv auswirkt.

Was wäre ein konkretes Beispiel im Übersetzeralltag?

Na ja, nehmen wir mal den Klassiker: Man muss nur daran denken, wie viele Kunden (aber auch Sprachdienstleister) den Text einer Webseite immer noch zuerst in Word kopieren, anstatt diesen mit wenigen Klicks direkt in das jeweilige CAT-Tool zu importieren.

Man kann also sagen, dass Übersetzer in Kursen zur Sprachtechnologie an der ZHAW vor allem den effizienteren Umgang mit CAT-Tools erlernen.

Genau, aber es werden nicht nur CAT-Tools behandelt. In den meisten Kursen geht es um einen Mix aus Computerlinguistik und Sprachtechnologie. Wir schauen uns die Anwendungen der Computerlinguistik in der Sprachtechnologie an – also jene, die in der verfügbaren Sprachtechnologie umgesetzt worden sind – und zeigen den Teilnehmenden, wie sie diese im Alltag am besten einsetzen können. Und natürlich hoffen wir, ihnen dadurch das Leben zu erleichtern (lacht).

Mit wie vielen CAT-Tools arbeiten die Übersetzer denn in euren Kursen?

In der Regel werden immer zwei durchgenommen, wobei eines der CAT-Tools aus Gründen der Verbreitung Standard ist.

Ist denn die Arbeit mit nur zwei CAT-Tools nicht etwas einseitig? Immerhin gibt es auf dem Markt mittlerweile eine ganze Reihe von unterschiedlichen Anwendungen.

Nein, denn der Fokus liegt vielmehr auf den Mechanismen, die sich dahinter verstecken. Insgesamt unterscheiden sich die Grundfunktionalitäten der verschiedenen Anwendungen nicht gross voneinander. Es gibt sicher Unterschiede bei der Segmentierung, oder ein bestimmtes Tool kann auf andere Ressourcen zugreifen – die Trefferquoten sind aber bei allen Systemen ähnlich.

Was muss man sich unter solchen Mechanismen vorstellen?

Ein Beispiel für einen CAT-Mechanismus, den es zu verstehen gilt, ist etwa die Subsegmentsuche – also die Funktion, die z. B. bei SDL Trados «AutoSuggest» genannt wird. Hier schauen wir uns genau an, was diese Funktion leisten kann, warum sie während des Übersetzens Vorschläge macht oder eben nicht, und wie sie mit den zur Verfügung stehenden Daten zu konfigurieren ist. Wenn die Funktionsweise nicht bekannt ist, hat man als Übersetzer zwar ein tolles Feature, das allerdings nicht richtig oder gar nicht genutzt wird. Auch reguläre Ausdrücke sind ein wichtiger Bestandteil des computerlinguistischen Wissens, z. B. um bestimmte Dateitypen richtig darzustellen oder aber um automatisierte Ersetzungen vorzunehmen.

Apropos Mechanismen: Was hältst du von der maschinellen Übersetzung und welche Rolle sollte diese deines Erachtens im Übersetzeralltag einnehmen?

(Denkt nach) Also, aus sprachtechnologischer Sicht ist es unheimlich spannend, wie stark sich dieser Bereich weiterentwickelt hat und wie die Ergebnisse in vielerlei Hinsicht auch besser geworden sind. Ich verstehe aber auch die Sorgen vieler Übersetzer sowie diesen gewissen Widerstand, nicht unbedingt die Rolle des Post Editors einnehmen zu wollen. Die grosse Herausforderung ist es meiner Meinung nach, die maschinelle Übersetzung in den Gesamtablauf so einzubinden, dass man für die sprachliche Übertragung immer noch die besten Übersetzer gewinnen kann und nicht nur jene, die sich zur Arbeit mit maschinell verarbeiteten Daten bereit erklären.

Es ist also keine Entweder-Oder-Frage?

Nein, ganz und gar nicht. Die Berührungsängste vieler Übersetzer hinsichtlich der maschinellen Übersetzung haben meist mit einem vermeintlichen Kontrollverlust zu tun. Deshalb spielt hier der psychologische Aspekt eine zentrale Rolle: Will man die maschinelle Übersetzung langfristig etablieren, dann müssen die Arbeit des Übersetzers sowie der Übersetzer selbst im maschinellen Translationsprozess mitberücksichtigt werden – und zwar so, dass die Übersetzer die Ergebnisse jederzeit selber kontrollieren können. Und damit komme ich wieder auf die Bedeutung der Computerlinguistik im Übersetzeralltag zurück: Es ist einfach wichtig, dass Übersetzer ihre Hemmungen abbauen und sich aktiv mit diesem und verwandten Themen auseinandersetzen. Dies wird es ihnen ermöglichen, sich die Rosinen aus der maschinellen Übersetzung herauszupicken und zu ihrem Vorteil zu nutzen.

Dennoch sind die Tücken, die die maschinelle Übersetzung mit sich bringt, nicht ganz unerheblich. Man denke an die Fehlerarten, die maschinelle Übersetzungssysteme ausspucken...

Damit setzen wir uns in unseren Kursen ebenfalls auseinander. Wir zeigen den Teilnehmenden, welche Fehlertypen auftreten können und bereiten sie entsprechend auf das Korrekturlesen bzw. auf das so genannte Post Editing vor. Das Ziel ist es, als Anwender in der gesamten Datenflut die Prioritäten so zu setzen, dass weiterhin qualitativ hochwertige Texte geliefert werden können.

Können sich Sprachdienstleister an der ZHAW speziell in Computerlinguistik und Sprachtechnologie weiterbilden?

Wir haben in den letzten Jahren zwar einen CAS-Lehrgang in Sprachtechnologie angeboten, dieses wird jedoch im Moment aufgrund neuer Entwicklungen grundlegend überarbeitet. Das Angebot an Weiterbildungskursen und CAS-Lehrgängen für Sprachdienstleister an der ZHAW bleibt weiterhin vielfältig. Im Sommer fand die erste Sommerschule «Barrierefreie Kommunikation» statt, eine Neuauflage ist schon in Planung. Darüber hinaus gibt es in den CAS-Lehrgängen «Übersetzen» und «Terminologie» Module zur Sprachtechnologie und zu den relevanten Werkzeugen. Ich bin zuversichtlich, dass wir dieses Angebot demnächst mit einem spannenden und innovativen Kurs in Sprachtechnologie ergänzen können.

Kommentar schreiben

Kommentare: 0