Mit dem FORBES-NEWSLETTER bekommen sie regelmässig die spannendsten Artikel sowie Eventankündigungen direkt in Ihr E-mail-Postfach geliefert.
Als Chief Trust Officer des Unternehmens Mostly AI ist Alexandra Ebert Expertin für den verantwortungsvollen Umgang mit künstlicher Intelligenz und synthetischen Daten. Das österreichische Unternehmen arbeitet an der Lösung von Datenschutzproblemen und einer weltweiten Daten-Demokratisierung durch synthetische Daten mit – was das heisst, erklärt sie selbst.
„Daten sind eine kostbare Ressource für unsere Gesellschaft und sollten – ähnlich wie Wasser oder Strom – nicht nur einigen wenigen, sondern allen zur Verfügung stehen“: So eröffnet Mostly AIs Chief Trust Officer (CTO) und Under 30-Listmakerin Alexandra Ebert unser Gespräch. In ihrer Funktion bei Mostly AI sucht sie im thematischen Spektrum der künstlichen Intelligenz nach Überschneidungspunkten mit Politikern, Experten und Unternehmern. Gerade Letztere können laut Ebert sehr von synthetischen Daten profitieren und sind auch im Moment die Hauptnutzer von künstlich generierten Daten; zumindest bei Mostly AI.
Synthetische Daten sind dabei künstlich erzeugte Datensätze, die nicht aus realen Beobachtungen oder Messungen stammen, sondern mithilfe von Algorithmen oder Generative-Modellierungsverfahren aus gewonnenen Daten erstellt werden. „Sobald reale Daten synthetisiert werden, sind sie irreversibel anonymisiert und dürfen ohne Datenschutzauflagen frei verwendet werden. Gleichzeitig erhalten synthetische Daten aber all die granularen, statistischen Informationen – also genau die ‚Insights‘ –, die auch reale Daten nützlich machen. Das macht sie zu einer besseren Alternative, als sensible Echtdaten zu nutzen“, erklärt Ebert. Diese Daten werden hauptsächlich verwendet, um reale Daten zu simulieren, und können in verschiedenen Bereichen wie maschinellem Lernen, Data Mining, Datenschutz und Sicherheit eingesetzt werden. Durch die Verwendung synthetischer Daten können Forscher und Unternehmen sensible oder vertrauliche Daten schützen, indem sie ähnliche, aber nicht identische Datensätze erstellen, die für Analysen und Trainingszwecke verwendet werden können.
„Herkömmliche Anonymisierung ist in etwa so, als würde man alle als sensibel erachteten Datenpunkte wie mit einem Edding-Stift durchstreichen. Der Datensatz sieht danach aus wie ein Schweizer Käse und ist kaum noch brauchbar. Aber noch viel schlimmer: Man weiss heute, dass diese destruktiven Verfahren dennoch nicht sicher sind und leicht rückgängig gemacht werden können“, erklärt Ebert.
Unternehmen, die häufig mit sensiblen Daten umgehen – wie Versicherungen, Banken oder Unternehmen im Gesundheitsbereich –, greifen daher oft auf synthetische Daten zurück; denn häufig brauche es nur wenige Datenpunkte, um eine ausgiebige Historie einer Person zu erstellen, erklärt Ebert: „Eine Studie über herkömmliche Anonymisierung von Kreditkartendaten hat gezeigt, dass nur drei – vermeintlich anonymisierte – Transaktionen pro Kunde ausreichen, um über 80 % der Kunden wieder zu reidentifizieren.“
Als 2018 die DSGVO (Datenschutz-Grundverordnung) in Kraft trat, standen viele Unternehmen vor einem Problem: Daten durften nicht mehr genutzt werden, ohne zensiert oder anonymisiert zu werden. „Das führte zu einer grossen Herausforderung, da die EU, um ein global relevanter KI-Player zu werden, den Grossteil der Unternehmen dazu bringen muss, KI einzusetzen und zu entwickeln. Diese KI-Entwicklung benötigt bekannterweise Berge an Daten, die durch die DSGVO nur sehr eingeschränkt genutzt werden dürfen. Wie soll das zusammenpassen?“, so Ebert – eine Frage, auf die sie am Ende ihres Marketingstudiums, im Rahmen ihrer Masterarbeit, stiess und über die sie die Mostly-AI-Gründer Michael Platzer, Klaudius Kalcher und Roland Boubela kennenlernte.
„Nachdem ich meine Masterarbeit abgeschlossen hatte, wandten sich die Gründer von Mostly AI an mich und schlugen vor: ‚Hey, das ist genau das Problem, das wir hier mit synthetischen Daten lösen. Wir wollen dieses Spannungsfeld zwischen Datenschutz und Datennutzung auflösen. Möchtest du nicht zu uns kommen und Teil des Teams werden?‘“, erzählt Ebert. Sie ist mittlerweile nicht nur Teil des Führungsteams bei Mostly AI, sondern auch Vorsitzende der IEEE-Expertengruppe für synthetische Daten und engagiert sich zudem in einer Gruppe von KI-Experten für die „Human AI-Initiative“, die darauf abzielt, KI inklusiver und für alle zugänglich zu machen.
Mostly AI ist im B2B-Bereich tätig und entwickelt eine Software, mit der Kunden ihre eigenen Daten synthetisieren können, um sie für Analysen und Statistiken zu nutzen. „Kunden wie Versicherungen oder Banken würden niemals ihre sensiblen Kundendaten an ein kleines Start-up senden. Daher haben wir eine einfach zu bedienende Software entwickelt, die unsere Kunden selbstständig verwenden. Wir bekommen deren sensible Kundendaten nicht zu Gesicht“, erklärt Ebert.
Der wachsende Fokus auf Datenschutz hat auch das Wachstum von Mostly AI ermöglicht. Das Team um Ebert besteht heute aus 35 Mitarbeitern und hat insgesamt 35 Mio. € an Finanzierungen erhalten, darunter eine Investition von 25 Mio. US-$ im Jahr 2022 vom britischen VC-Unternehmen Molten Ventures.
Für die Zukunft will Ebert noch weitere Anwendungsgebiete von synthetischen Daten erforschen. Diese werden laut ihr in der gesellschaftlichen Daten-Demokratisierung eine grosse Rolle spielen. Ebert: „Mit der Demokratisierung von Daten erreichen wir als Gesellschaft, dass statt nur wenigen grossen Playern auch Start-ups, die Forschung, Non-Profit-Organisationen oder kleine und mittlere Unternehmen von KI und Dateninnovationen profitieren können; also all jene, die häufig keinen Zugang zu relevanten Datensätzen haben. Aber damit diese Datensätze sowohl nützlich als auch datenschutzkonform sind, braucht es synthetische Daten.“
Alexandra Ebert ist Expertin für KI, synthetische Daten und Datenschutz und arbeitet als Chief Trust Officer bei Mostly AI. Als Mitglied des Führungsteams befasst sie sich mit politischen Fragen im Bereich der synthetischen Daten und ethischen KI und ist verantwortlich für den Austausch mit der Datenschutz-Community, mit Aufsichtsbehörden, den Medien und mit Kunden.
Fotos: Alexandra Ebert/Aragon AI, Alexandra Ebert