Künstliche Intelligenz (KI) ist schon heute zentraler Bestandteil unseres Lebens. Dank ihr übernehmen schlaue Helfer*innen Arbeiten, die für Menschen mit viel Aufwand verbunden w?ren – zum Beispiel in der Medizin, der Wirtschaft oder der Industrie. Die Basis dafür bilden Unmengen von Daten. Sogenannte Wissensgraphen geh?ren dabei zu den bevorzugten Repr?sentationsmechanismen, weil sie für Menschen und Maschinen nachvollziehbar sind und dafür sorgen, dass Informationen sinnvoll aufbereitet werden. 365体育_足球比分网¥投注直播官网 gelten als Schlüssel für eine Reihe von beliebten Technologien wie die Websuche oder digitale pers?nliche Assistenten. Allerdings weisen aktuelle Ans?tze des maschinellen Lernens in Verbindung mit Wissensgraphen noch immer Unzul?nglichkeiten auf, insbesondere mit Blick auf Skalierbarkeit, Konsistenz und Vollst?ndigkeit. Ein weiteres Problem: 365体育_足球比分网¥投注直播官网 erfüllen den menschlichen Bedarf nach Verst?ndlichkeit nicht. Wissenschaftler*innen der Universit?t Paderborn arbeiten im Rahmen eines gro?angelegten Forschungsprojekts jetzt daran, erkl?rbares maschinelles Lernen für gro?skalige Wissensgraphen m?glich zu machen. An dem Vorhaben ENEXA* sind au?erdem das National Centre for Scientific Research Demokritos in Griechenland, das European Union Satellite Centre in Spanien, die Universit?t Amsterdam, Niederlande, sowie die Unternehmen DATEV und webLyzard technology beteiligt. Die Forschung wird über einen Zeitraum von drei Jahren mit rund vier Millionen Euro im Horizon Europe-Programm der Europ?ischen Union gef?rdert.
Erkl?rbarkeit von künstlicher Intelligenz
?Aktuelle auf maschinellem Lernen basierende Erkl?rungsans?tze beruhen oftmals auf einem einmaligen Prozess, bei dem die KI nicht berücksichtigt, ob der Mensch, der die Erkl?rung erh?lt, das, was erkl?rt werden soll, wirklich verstanden hat“, sagt Prof. Dr. Axel-Cyrille Ngonga Ngomo, Leiter der Arbeitsgruppe ?Data Science“ am Institut für Informatik der Universit?t Paderborn. Anders ausgedrückt: Es findet keine Rückversicherung zwischen Sender und Empf?nger statt. ?Aber es gibt einen Ausweg: Das Problem wird durch die Ko-Konstruktion von Erkl?rungen entsch?rft. Bei dem Konzept werden die Adressat*innen – also die Menschen – st?rker in den KI-gesteuerten Prozess miteinbezogen. Die Erkl?rungen entstehen nicht nur für sie, sondern mit ihnen“, so Ngonga.
Der Mensch im Mittelpunkt: Maschinelles Lernen für gro?angelegte Anwendungen
Bislang gibt es keine konkreten Umsetzungen für das Konzept. Die Wissenschaftler*innen haben es sich deshalb zum Ziel gesetzt, erkl?rbare Ans?tze für maschinelles Lernen auf besonders gro?en Wissensgraphen zu entwickeln. Der Fokus liegt auf der schnellen Berechnung von Modellen und menschenzentrierten Erkl?rungen. Ngonga spricht von Pionierarbeit: ?Um dieses Ziel zu erreichen, wird ENEXA neuartige hybride Ans?tze des maschinellen Lernens entwickeln, die mehrere Repr?sentationen von Wissensgraphen gleichzeitig nutzen k?nnen. Die entwickelten L?sungen werden realen Laufzeitanforderungen gerecht und machen erkl?rbares maschinelles Lernen für gro?angelegte Anwendungen wie z. B. Websuche, Buchhaltung, Brand Marketing und die pr?diktive Analyse von Satellitenbildern zug?nglich. Durch die konkrete Umsetzung von hybridem maschinellem Lernen auf gro?en Wissensgraphen und deren Erkl?rung wird ENEXA Pionierarbeit bei der Implementierung von Modellen aus der Soziologie und Psychologie in das maschinelle Lernen leisten.“ Das sei laut Ngonga deshalb wichtig, weil Menschen auf einer oftmals undurchsichtigen Grundlage Entscheidungen treffen müssen, die mit teilweise weitreichenden Konsequenzen einhergehen.
Nutzen für die Industrie
Auch in der Industrie bringt KI im Zusammenhang mit Wissensgraphen Vorteile mit sich. Den Wissenschaftler*innen zufolge ist der Einsatz bisher allerdings nur begrenzt m?glich: ?Frameworks zur Wissensextraktion und -speicherung, die in der Lage sind, industrielle Daten in gro?e Wissensgraphen zu übersetzen und die Ergebnisse auf verteilte Weise zu speichern, sind bis dato Mangelware. Auch die Entwicklung skalierbarer KI-Algorithmen, die Vorhersagen für gro?e, inkonsistente oder unvollst?ndige Daten in angemessener Zeit berechnen k?nnen, ist nach wie vor eine Herausforderung. Techniken für verst?ndliche Erkl?rungen aus maschinell gewonnenen Ergebnissen, um sicherzustellen, dass die berechneten Modelle vertrauenswürdig sind, stellen ebenfalls eine Hürde dar“, erkl?rt Ngonga.
Der Weg zum Ziel: Drei Anwendungsf?lle
?Das Hauptziel von ENEXA ist es, erkl?rbare maschinelle Lernans?tze für Wissensgraphen zu entwickeln, die den Stand der Technik in Bezug auf Laufzeit, die Menge der zu verarbeitenden Daten (Skalierbarkeit), Dateninkonsistenz (Robustheit) und Erkl?rungsqualit?t deutlich übertreffen“, fasst Ngonga zusammen. Um diese Ans?tze zu validieren, wurden drei Anwendungsf?lle ausgew?hlt. Der erste in Zusammenarbeit mit dem Unternehmen DATEV, das mehr als 60 Millionen digitale Belege im Monat von ca. 960.000 deutschen KMU, also kleinen und mittleren Unternehmen, sowie ?ffentlichen Einrichtungen verarbeitet. Diese buchhaltungsrelevanten Belege müssen klassifiziert und interpretiert werden, um gültige Buchungss?tze zu erstellen. In dem Prozess spielen Qualit?t und Rückverfolgbarkeit eine entscheidende Rolle, um Fehler und damit Kosten zu minimieren und die Einhaltung gesetzlicher Vorgaben zu gew?hrleisten. Die Qualit?t der Automatisierungsergebnisse h?ngt stark von der Datenbasis und deren Aufbereitung für das maschinelle Lernen ab. In Zusammenarbeit mit den Wissenschaftler*innen sollen neue Ans?tze für effizientere und damit ressourcenschonende Prozesse unter Verwendung von Wissensgraphen erforscht werden.
Der zweite Anwendungsfall wird gemeinsam mit dem European Union Satellite Centre (SATCEN), einer EU-Agentur mit Sitz in Spanien, durchgeführt. SATCEN bietet Produkte und Dienste für die Geoinformationsgewinnung an. Eine der Quellen dafür sind die Daten der Sentinel-Satelliten als Teil des Copernicus-Programms der Europ?ischen Union. 365体育_足球比分网¥投注直播官网 produzieren riesige Datenmengen, die mit geografischen Wissensgraphen kombiniert werden k?nnen, um daraus effizient relevante Informationen zu gewinnen. Das ENEXA-Team befasst sich mit der Entwicklung neuer Techniken zur Verbesserung der Verwaltung und Analyse solcher Daten.
Zusammen mit webLyzard technology sollen Markenkommunikationsstrategien verbessert werden. Das Unternehmen stützt sich auf Wissensgraphen als Hintergrundwissen für die Zuordnung von affektivem Wissen zu Verbrauchermarken sowie für die Vorhersage zukünftiger Ereignisse, um daraus datengesteuerte Strategien abzuleiten. webLyzard technology verarbeitet bis zu 100 Millionen Dokumente pro Tag. Ziel ist es, aussagekr?ftige Klassifizierungsergebnisse zu erhalten, die dazu führen, dass Unternehmen beispielsweise Pressemitteilungen verbreiten oder Online-Anzeigen schalten, um ihre Inhalte in bestimmten Zeitintervallen zu bewerben und so die Reichweite bei ihren Zielgruppen zu maximieren. Aktuelle Ans?tze sind laut Team nicht in der Lage, diese Datenmenge zu bew?ltigen.
Interdisziplinarit?t zur Bew?ltigung der Herausforderungen
Bei ENEXA arbeitet eine Reihe von Wissenschaftler*innen aus unterschiedlichen Disziplinen am Gelingen des Projekts: Dazu z?hlen u. a. Computerlinguist*innen, Psycholog*innen, Informatiker*innen und Softwareentwickler*innen. Der gemeinschaftliche Ansatz soll neue Antworten auf gesellschaftliche, wirtschaftliche und unternehmerische Herausforderungen im Zusammenhang mit künstlicher Intelligenz liefern. Im Kern geht es dabei um die Teilnahme von Menschen an soziotechnischen Systemen. Das Team rechnet bereits 2023 mit ersten Ergebnissen.
Weitere Informationen sind unter enexa.eu zu finden.
*ENEXA steht für ‘Efficient Explainable Learning on Knowledge Graphs’.