30.08.2023 Künstliche Intelligenz: Ja, aber fair!

Eine fachübergreifende Zusammenarbeit entwickelte einen gerechten Ansatz zum Datenteilen: Wer mehr beiträgt, profitiert auch mehr

Wie Künstliche Intelligenz fair zu verteilen sei, untersuchte ein Team aus der Marburger Informatik und Wirtschaftswissenschaft, darunter (von links) Professor Dr. Michael Leyer, Professor Dr. Dominik Heider, Dr. Adele Ribeiro und Mohammad Tajabadi.

Wer die meisten Daten für das Training Künstlicher Intelligenz beiträgt, soll auch die beste Leistung erhalten: Mit einem neuartigen Ansatz aus der Marburger Informatik und Wirtschaftswissenschaft lässt sich eine solcherweise gerechte Datennutzung gewährleisten. Das berichtet eine fachübergreifende Forschungsgruppe um den Marburger Informatiker Professor Dr. Dominik Heider im Fachblatt „Journal of Medical Internet Research“.

Künstliche Intelligenz – das öffentlichkeitswirksame Schlagwort klingt verheißungsvoll, für manche vielleicht auch bedrohlich. „Künstliche Intelligenz oder kurz KI zeichnet sich dadurch aus, dass sie große Datenmengen schnell verarbeitet und darin Muster sowie Trends erkennt, die für den Menschen nicht sofort ersichtlich sind“, erläutert Dominik Heider von der Philipps-Universität Marburg, der die Studie leitete.

So erweist sich KI in der Medizin als äußerst hilfreich, zum Beispiel wenn es darum geht, Risikofaktoren für Krankheiten zu identifizieren, neue Medikamente und Impfstoffe oder maßgeschneiderte Therapien zu entwickeln. „Wie gut die Ergebnisse einer KI sind, hängt jedoch stark davon ab, dass sie mit einer großen Menge von Daten trainiert wird, die vielfältig und repräsentativ für die Bevölkerung sind“, erklärt Heiders Mitarbeiter Mohammad Tajabadi, einer der Leitautoren des Fachaufsatzes. „Um leistungsfähige KI-Modelle für medizinische und gesundheitliche Anwendungen zu entwickeln, müssen üblicherweise Daten aus verschiedenen Quellen gesammelt und zusammengeführt werden.“

Es gibt jedoch Hindernisse, die dem Teilen von Daten entgegenstehen, zum Beispiel der Datenschutz; „auch gewinnorientierte Unternehmen halten in der Regel ihre eigenen geschäftsbezogenen Daten zurück, da die Verwendung durch konkurrierende Unternehmen ihren eigenen wirtschaftlichen Erfolg beeinträchtigen könnte“, ergänzt der Marburger Wirtschaftswissenschaftler Professor Dr. Michael Leyer, ein weiterer Mitverfasser.

Neue Konzepte wie Federated Learning und Schwarmlernen ermöglichen das gemeinschaftliche Training von maschinellen Lernmodellen auf verteilten Geräten, ohne dass Patientendaten weitergegeben werden müssen. Aber wie profitieren eigentlich diejenigen von den Ergebnissen, von denen die Daten stammen? „Die Vorteile der Zusammenarbeit können für die Beteiligten unausgewogen sein“, führt Leyer aus. „Man braucht einen Mechanismus, der Unternehmen zur Teilnahme an gemeinschaftlichen Datenanalysen ermutigt, aber gleichzeitig ein faires Gleichgewicht zwischen den Beiträgen und Vorteilen aller Beteiligten gewährleistet.“

Diese Aufgabe ging das Team mit einem neuartigen Ansatz an: „Wir simulierten ein Netz, in dem die Knoten gemeinsam Modelle für maschinelles Lernen trainieren, deren Leistungsniveau der Menge beigetragener Daten entspricht“, legt Heider dar. Als Beispiel verwendete das Team einen Datensatz zur Gesundheit von Müttern, aus dem es Modelle entwickelte, mit denen sich Risiken bei einer Schwangerschaft vorhersagen lassen.

„Durch unseren Ansatz des fairen Schwarmlernens erhält diejenige Partei, die die meisten Daten beisteuert, das beste endgültige Ergebnis“, berichtet Tajabadi. „Alle anderen erhalten immerhin Modelle, die besser sind als die, die nur mittels ihrer lokalen Daten trainiert wurden.“

Das Konzept bringt demnach für alle Beteiligten Vorteile, wie Heider resümiert: „Organisationen mit mehr Ressourcen sind eher bereit, mit anderen Parteien für eine gemeinsame Lernaufgabe zusammenzuarbeiten, da die Auszahlung fair ist. Aber von der Zusammenarbeit mit anderen Parteien profitieren auch diejenigen, die weniger Ressourcen zur Verfügung stellen; sie werden sich daher vermutlich ebenfalls beteiligen.“

Professor Dr. Dominik Heider leitet die Marburger Arbeitsgruppe Data Science in der Biomedizin. Er ist Sprecher des Forschungsprojekts „MOSLA“, das die hessische Landesregierung aus dem Förderprogramm „LOEWE“ finanziert. Professor Dr. Michael Leyer lehrt Digitalisierung und Prozessmanagement am Fachbereich Wirtschaftswissenschaften der Philipps-Universität und ist Adjunct Professor an der Queensland University of Technology (QUT) in Australien. Neben den beiden Marburger Teams beteiligte sich Dr. Linus Grabenhenrich vom Robert-Koch-Institut an der Forschungsarbeit.

Originalveröffentlichung: Mohammad Tajabadi & al.: Sharing data with shared benefits: An AI perspective, Journal of Medical Internet Research 2023, DOI: http://dx.doi.org/10.2196/47540

Kontakt Pressestelle