Ausgezeichnete KI-Arbeiten
03/07/2023Die Studenten Simon Hentschel (Informatik) und Stanislaus Kruschinski (Anglistik) sind für ihre Abschlussarbeiten ausgezeichnet worden. Beide haben sich mit Künstlicher Intelligenz befasst. (aus: einBLICK vom 07.03.2023)
Neueste Übersetzungsprogramme, die mit Künstlicher Intelligenz arbeiten, könnten bei bestimmten Sprachfeinheiten deutlich besser sein. Das zeigt Stanislaus Kruschinski in seiner Masterarbeit. Angefertigt hat er sie in der englischen Sprachwissenschaft der Julius-Maximilians-Universität (JMU) Würzburg.
Für die Arbeit wurde der junge Wissenschaftler mit einem Preis ausgezeichnet, den die Vogel Stiftung Dr. Eckernkamp (Würzburg) jedes Jahr vergibt. Die Auszeichnung geht an herausragende studentische Abschlussarbeiten, die sich mit den Themen Künstliche Intelligenz und Digitalisierung befassen. Preiswürdige Arbeiten werden der Stiftung vom JMU Center for Artificial Intelligence and Data Science (CAIDAS) vorgeschlagen.
Geisteswissenschaften tragen zu KI-Forschung bei
Über den mit 1.000 Euro dotierten Preis freut sich Stanislaus Kruschinski sehr. „Ich hoffe, dass meine Arbeit langfristig dazu beitragen kann, Übersetzungsalgorithmen weiter zu verbessern“, sagt er. An dieser Thematik will der gebürtige Bad Kissinger weiterforschen: Er strebt eine Doktorarbeit an der JMU an.
Stolz sind auch Dr. Ninja Schulz und Professorin Carolin Biewer, die Erst- und die Zweitbetreuerin der preisgekrönten Masterarbeit. „Uns aus dem Fachbereich Anglistik/Amerikanistik hat die Auszeichnung besonders gefreut, weil sie zeigt, dass die Geisteswissenschaften etwas zur KI-Forschung beitragen können und dass unser Masterstudiengang English Speaking Cultures eine solche interdisziplinäre Forschung ermöglicht.“
Worum es in der Masterarbeit ging
Diskursmarker: So heißen die Sprachfeinheiten, bei denen KI-basierte Übersetzungsprogramme noch besser werden könnten.
Stanislaus Kruschinski erklärt: „Wenn man sich einen Satz wie eine Straße vorstellt und einen Text wie ein Straßennetz, dann sind Diskursmarker wie Schilder, die den richtigen Weg weisen.“ Im Deutschen sei zum Beispiel das Wort „aber“ ein Diskursmarker: Zwischen zwei Sätzen gesprochen, kündigt es den Zuhörenden eine Einschränkung oder einen Gegensatz zum vorher Gesagten an. Es zeigt gewissermaßen an, in welche Richtung sich der Text weiterentwickelt.
Kruschinski hat untersucht, wie die auf neuronalen Netzen basierenden Programme von Google und DeepL mit fünf englischen Diskursmarkern umgehen: but, so, well, you know und I mean. Dazu verwendete er einen Textkorpus von mehr als 700 Debatten von US-amerikanischen Präsidentschaftskandidaten der späten 1990er-Jahre bis 2016. Aus den Reden wählte er 155 beispielhafte Sequenzen aus und ließ sie ins Deutsche übersetzen.
Seine Analyse zeigt: „Auch neuere Algorithmen haben Probleme, Diskursmarker adäquat zu übersetzen“, erklärt der Sprachwissenschaftler. „Oberflächlich gelesen, klingen die Ergebnisse zwar wie gutes Deutsch. Aber beim genaueren Hinsehen findet man Fehler.“ Beispielsweise beim Diskursmarker „you know“. Der werde immer richtig übersetzt, wenn er am Anfang eines Satzes steht. Findet er sich aber am Satzende oder an einer ungewöhnlichen Position in der Satzmitte, hapert es mit der Übersetzung.
Es kommt auch vor, dass Diskursmarker gar nicht übersetzt werden. Der Sinn eines Textes gehe dadurch in der Regel zwar nicht verloren, erklärt Kruschinski. Aber in der Übersetzung fehle dann eine wichtige textliche Interpretationsebene – besonders wenn man davon ausgeht, dass Diskursmarker in Reden oder Texten sehr bewusst gesetzt werden.
Stanislaus Kruschinski hat seine Masterarbeit mit dem Titel „A Study on the Ability of Neural-Based Machine Translation Systems to Handle Discourse Markers“ im August 2022 abgeschlossen. Den CAIDAS-Preis bekam er Ende 2022 bei einer Feier am Institut für Informatik verliehen.
Neuronales Netz CLIP bewertet Bildästhetik
Zusammen mit Stanislaus Kruschinski wurde JMU-Student Simon Hentschel geehrt. Er erhielt den ebenfalls mit 1.000 Euro dotierten CAIDAS-Preis für die beste Bachelorarbeit des Jahres. Sein Thema: „Image Aesthetics Assessment using Contrastive Language-Image Pre-training“. Betreuer der Arbeit am Institut für Informatik waren Konstantin Kobs und Professor Andreas Hotho.
Simon Hentschel hat sich mit dem neuronalen Netz CLIP befasst, das von OpenAI entwickelt und veröffentlicht wurde, dem Unternehmen hinter ChatGPT. CLIP wurde mit einer großen Menge von Bildern und dazugehörigen Beschreibungstexten trainiert, sodass passende Bilder und Texte einen höheren „Kompatibilitätsscore“ haben als Bild-Text-Paare, die nicht zusammenpassen. So kann CLIP die Inhalte von Bildern klassifizieren: Es schätzt ein Hundebild zum Text „Ein Bild eines Hundes“ kompatibler ein als zum Text „Ein Bild einer Katze“.
Kann CLIP auch für die Einschätzung der Bildästhetik verwendet werden? Das hat Simon Hentschel untersucht. Ist ein Bild schön? Ist ein Bild schöner als ein anderes? Diese Aufgabe zielt nicht nur auf den Inhalt ab, sondern auch auf den Stil, das Licht und die Komposition von Bildern. Dazu stellte der JMU-Student verschiedene, teils selbst entwickelte Methoden gegenüber. Er zeigte, dass CLIP auch ohne Extra-Training für diese Aufgabe geeignet ist. Eine erweiterte Version seiner Bachelorarbeit wurde im Journal „Frontiers in Artificial Intelligence“ veröffentlicht.
Motivation der Vogel Stiftung
Die Vogel Stiftung Dr. Eckernkamp (Würzburg) vergibt jedes Jahr zwei CAIDAS-Preise an die JMU – jeweils für die beste Bachelor- und für die beste Masterarbeit, die sich mit Themen der Künstlichen Intelligenz und Digitalisierung befassen.
„Wir möchten damit exzellente Nachwuchsforscherinnen und Nachwuchsforscher zu weiteren Arbeiten auf diesen Gebieten motivieren“, sagt Stiftungsvorstand Dr. Gunter Schunk. Außerdem will die Stiftung die Etablierung des CAIDAS unterstützen. Die JMU baut dieses Forschungszentrum seit 2019 auf; finanziell gefördert wird es in der Hightech Agenda des Freistaats Bayern.