Datenschutz und KI

Datenschutz und künstliche Intelligenz (vgl.: KI) schaffen neue Herausforderungen – für Betroffene und Verantwortliche von KI basierenden Lösungen, aber vor allem für die, die solche KI Systeme entwerfen und umsetzen. Es gibt kein Patentrezept und keine Standard Lösung – auch Verschlüsselung ist es nicht! Hier ist ein individueller qualitätsorientierter Ansatz gefordert. Nicht mehr und nicht weniger fordert auch die Datenschutz Grundverordnung (vgl.: DSGVO). Wird der von der DSGVO postulierte Designansatz verfolgt – Privacy by Design – dann ist das Ergebnis qualitativ höherstehend und somit auch ein Wettbewerbsvorteil.

Die Problemstellungen in Bezug auf KI und Datenschutz ergeben sich vor allem im Bereich des maschinellen Lernens (vgl.: ML), einem Teilbereich der KI. Eine KI Lösung braucht zum Erlernen von Fähigkeiten Trainingsdaten. Je größer die Menge an Trainingsdaten ist, desto höher wird die korrekte Trefferquote von darauf basierenden Aussagen. Oft sind personenbezogene Daten Teil der Anwendungsfälle. Das heisst, personenbezogene Daten müssen dann zum Trainieren der KI verwendet werden.

Exkurs: personenbezogene Daten kann man grob in drei Gruppen einteilen,

  • Daten, die über persönliche Verhältnisse Auskunft geben, wie Anschrift, Geburtsdatum, Ausbildung, Fotos etc.
  • Daten, die über sachliche Verhältnisse Auskunft geben, wie Einkommen, Vermögen, Schulden, Eigentum etc.
  • Daten, die einen Rückschluss auf eine Person ermöglichen, wie Personalnummer, Kennzeichen etc.

Die schiere Menge, die an Trainingsdaten benötigt und auch verwendet wird, muss sich wiederfinden in den Anforderungen an die Gewährleistungsziele von Sicherheit und Datenschutz, die erreicht werden müssen. Das Thema ist in der öffentlichen Wahrnehmung vorhanden, vor allem aber achten die zuständigen Behörden auf deren Einhaltung und Umsetzung. (zB.: Eine nicht mehr ganz aktuelle Liste von Strafbescheiden kann hier eingesehen werden. Einige Verfahren sind noch nicht abgeschlossen, wie das gegen die Österreichische Post AG.)

Der Grat auf dem AI Entwickler wandeln ist offensichtlich sehr schmal. Auf der einen Seite steht die Benutzbarkeit und ein möglicher gesellschaftlicher Nutzen, auf der anderen Seite aber die Verletzung der digitalen Grundrechte, Datenschutz, des Einzelnen.

Ein möglicher Anwendungsfall von KI ist die Unterstützung der Strafvervolgungsbehörden mit automatisierter Bilderkennung. Seien es jetzt Bilder, Videos, von Missbrauchsopfern, oder aber auch von entführten Kindern bei denen eine KI gestützte Lösung mehrfach hilfreich sein kann. Hilfreich, weil eine in der Form einzigartig skalierbare und qualitativ gleichbleibende Erkennungsrate mit so einer Lösung umgesetzt werden kann, die aber auch als willkommener Nebeneffekt den Faktor Mensch psychisch entlastet. Solch ein System funktioniert aber nur mittels Gesichtserkennung und es werden (wahrscheinlich) soziale Medien, Foren, und ähnliches, durchforstet werden. Es werden alle verfügbaren Informationen, Bilder, etc., verwendet. (Anm.: Diese Seite könnte schon eine sehr große Datenbank aufgebaut haben – Pimeyes – ohne Einwilligung etc.)

Als letzte Konsequenz einer solchen Lösung steht die Möglichkeit jeden zu identifizieren und dazu beizutragen auch überall zu verfolgen. Das betrifft alle als Person erkennbaren Objekte, wie zufällige Passanten im Hintergrund von Bildern. Die Frage, die sich jetzt ein Entwickler diesbezüglich stellen muss, ist hier nicht nur, wie der zulässige gesetzliche Rahmen eingehalten werden kann, sondern auch, wie sind die ethischen Probleme, Dilemmata, zu lösen. Ist der Eingriff in die Privatsphäre zulässig, um entführte, missbrauchte, Kinder zu finden? Diese Frage kann die KI Entwicklung aber natürlich nicht alleine beantworten.

Zurück zu den Trainingsdaten im fiktiven Anwendungsfall von KI. Damit ein solches System treffsicher die Gesichter von Kindern erkennen kann werden Millionen von Bildern mit unterschiedlichen Gesichtern benötigt. Abseits der Rechte am eigenen Bild stellt die Verarbeitung von Bilddaten eine Verarbeitung von personenbezogenen Daten (s.o.) dar.

Exkurs: Abseits vom Zweck sieht hier die DSGVO und Erwägungsrund 38 einen besonderen Schutz von Kindern vor. Artikel 23 DSGVO sieht hier einen Erlaubnisvorbehalt, eigentlich Beschränkung des Rechtsvorschrift, für Strafverfolgungsbehörden vor. Das entbindet sie aber nicht der dadurch entstehenden moralischen Verpflichtung der Bewahrung der persönlichen Integrität von Betroffenen durch diese spezielle Verarbeitung. Dazu ist der Nachweis über die Notwendigkeit und Verhältnismässigkeit des Eingriffs zum Beispiel einer Kontrollbehörde zum Beispiel darzulegen.

Den Aufwand für Test- und Trainingsdaten ein solches Register, einen solchen Katalog, oder eine solche Datenbank aufzubauen, für die auch die entsprechenden Einwilligungen, Einverständniserklärungen, für jedes einzelne Bild, durch die Erziehungsberechtigten in diesem Fall, für diesen Zweck vorliegen ist mir bis dato nicht bekannt. Den Zweck alleine auf Basis von Artikel 23 abzustellen kann natürlich aktzeptabel sein, aber dazu gibt es bis dato keine endgültige Erkenntnis.

Das Grundproblem zwischen KI und Datenschutz ist, dass sich der Zweck der Verarbeitung im Lebenszyklus des KI Systems ändert. Training als Verarbeitung verfolgt eigentlich einen anderen Zweck der Verarbeitung, als der geplante tatsächliche Verwendungszweck.

Verknüpft man diese Gesichtserkennung mit Überwachungs- und Verkehrskameras und offiziellen Personenregistern, dann ist damit eine Massenüberwachung im orwellschen Ausmass geschaffen. Damit kann jeder nicht nur identifiziert werden, sondern auch verfolgt werden, ungeachtet, ob er sich einer Straftat schuldig gemacht hat, oder auch nicht. Dieses und viele damit zusammenhängende Probleme lassen sich nicht mit einfachen Standardvorgehensweisen lösen – nein, auch Verschlüsselung hilft nichts, nein auch eine Zertifizierung kann hier nicht helfen!

Es gibt aber Ansätze, die bei der Bewältigung und Entwicklung einer Lösungsstrategie helfen können. Wie zum Beispiel nicht nur Logikelemente sondern auch Datensubjekte aufzuteilen. Solche Datensubjekte in Objektklassen zu aggregieren, den geforderten Informationsgehalt dabei zu bewahren, aber eine Rückführung auf einen Datenpunkt massiv zu erschweren, wenn nicht sogar verunmöglichen – Stichwort: differential privacy. Zum Schluss natürlich kann natürlich doch Verschlüsselung helfen, aber nicht alleine sondern nur in Kombination mit weiteren Maßnahmen. Zur Anwendung kommt homomorphe Verschlüsselung, die die Eigenschaft hat, dass Berechnungen mit verschlüsselten Objekten durchgeführt werden können, ohne dass diese Verschlüsselung aufgehoben werden muss. Die verschlüsselte Information wird nicht offengelegt, kann aber verarbeitet werden. Das Ergebnis der Berechnung mit den verschlüsselten Daten ist das selbe, wie mit Daten im Klartext.

Aktuell gibt es keine perfekte, einheitliche, Lösung. Gefragt sind Expertise und Hingabe zum Datenschutz in der Umsetzung und eine individuelle Umsetzung. Wo das Gleichgewicht zwischen Privatheit, Datenschutz, und Nutzen liegt lässt sich strategisch nur schwer absehen. Erkennbar aber sind die möglichen Nutzen und Vorteile durch den Einsatz von KI…


Sollten Sie Fragen haben, dann zögern Sie nicht und melden Sie sich bei uns.

Share on:

Schreibe einen Kommentar