Zur Reichweite der Löschungspflicht des Verantwortlichen
Simon Marx/Alicia Sütthoff*
I. Die Ubiquität von KI und der Datenschutz
Die Digitalisierung schreitet in allen Lebensbereichen voran: Dass Suchmaschinen präzise Antworten auf Suchanfragen geben können, sich Smartphones durch eine Gesichtserkennung entsperren lassen und intelligente Sprachassistenten die Menschen im Alltag unterstützen, ist längst keine Neuheit mehr.1 KI hat aber noch weit mehr Anwendungsfelder. So kommt sie auch in der Rechtspraxis zum Einsatz, um Akten und Verträge zu analysieren.2 Sogar für den Klimaschutz ist sie nützlich, indem sie Satellitenbilder auswertet, so das Verkehrsaufkommen analysiert und etwa ermitteln kann, wo welche Treibhausgasemissionen entstehen.3
Der massive Einsatz von Daten für die Entwicklung und den Einsatz der KI ruft indes das Datenschutzrecht auf den Plan: Bilddaten für das Entsperren des Smartphones, Audiodaten des Sprachassistenten und auch übrige Daten, wie etwa Sensor- oder GPS-Daten des autonomen Fahrzeugs, können wegen des weiten Begriffsverständnisses personenbezogener Daten nach der DS-GVO dazu führen, dass bei jener Verarbeitung deren Vorgaben zu beachten sind.4 Wenn eine KI-Entwicklerin personenbezogene Daten zum Training einer KI verwendet, stellt sich die Frage, welche Rechtsfolgen damit verbunden sein können. Der Aufsatz widmet sich statt einer überblicksartigen Darstellung möglicher Rechtsprobleme des Einsatzes von KI5 allein der praktisch höchst relevanten Frage, welche Pflichten den Verantwortlichen treffen, falls er zum Training der KI personenbezogene Daten verwendet hat und einer der Löschungsgründe des Art. 17 Abs. 1 DS-GVO vorliegt: Kann die betroffene Person verlangen, dass der Verantwortliche die KI, die mit ihren personenbezogenen Daten angelernt wurde, beseitigt?
II. Technischer Hintergrund
Die technische Funktionsweise von KI ist komplex. Eine einheitliche und rechtlich anerkannte Definition von KI existiert nicht. Für diesen Aufsatz genügt folgendes Verständnis: KI wird als Oberbegriff für Systeme verstanden, die menschliches Denken und Verhalten nachahmen, aus ihren Erfahrungen lernen und sich so weiterentwickeln, dass sie schließlich Aufgaben intelligent und automatisch6 wahrnehmen.7 Beim Machine Learning (ML) wird eine KI programmiert, die anhand von Trainingsdatensätzen auf ihren Einsatz in der Praxis vorbereitet und schließlich auf neue Daten angewendet wird.8 Die KI ist nach einem erfolgreichen Trainingsprozess in der Lage, bestimmte Probleme eigenständig zu lösen, indem sie das Wissen, das sie durch die Trainingsdatensätze erlangt hat, auf die neuen, unbekannten Daten anwendet.9
Unabhängig von der Wahl der Trainingsmethode10 basiert KI in der Regel auf neuronalen Netzen,11 deren Struktur der eines menschlichen Gehirns ähnlich ist.12 Ebenso wie das menschliche Gehirn bestehen künstliche neuronale Netze aus einer Vielzahl an Neuronen, die durch Synapsen verbunden sind.13 Die Neuronen und Synapsen sind in mehreren Schichten angeordnet.14 Zu Beginn des Trainings wird jedem Neuron ein Algorithmus und den Synapsen ein unterschiedliches Gewicht zugeordnet.15 Das Gewicht der Synapsen bestimmt, welche Neuronen aktiviert werden.16 Die Neuronen analysieren die Input-Daten mittels des ihnen zugewiesenen Algorithmus und kreieren so einen Output.17 Den Output geben die Synapsen an weitere Neuronen weiter, bis er an der Ausgabeschicht angelangt ist.
Es lässt sich demzufolge festhalten, dass eine untrainierte KI ein Algorithmus ist, der mit Hilfe von Trainingsdaten angelernt wird. Durch das ML wird aus der untrainierten eine trainierte KI, die sich ihrerseits als Algorithmus beschreiben lässt.18 Die Trainingsdaten wiederum werden dabei nicht zum Bestandteil der trainierten KI.
III. Gegenstand der Löschungspflicht/ des Löschungsanspruchs
Art. 17 Abs. 1 DS-GVO bestimmt als Rechtsfolge die Pflicht des Verantwortlichen und das Recht der betroffenen Person von dem Verantwortlichen fordern zu können, die sie betreffenden personenbezogenen Daten unverzüglich zu löschen, sofern einer der Löschungsgründe vorliegt.19 Dass die personenbezogenen Daten der betroffenen Person selbst Gegenstand der Löschungspflicht sind und auch sein sollen, ergibt sich aus dem eindeutigen Wortlaut der Vorschrift. Worum handelt es sich aber bei personenbezogenen Daten?
1. Begriffsbestimmung personenbezogener Daten
Personenbezogene Daten sind nach Art. 4 Nr. 1 DS-GVO alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen.
a) »Information […]«
Der Begriff der Information ist weit zu verstehen: Er umfasst neben äußeren Merkmalen, inneren Zuständen und Meinungen einer natürlichen Person auch die Beziehungen zu einer natürlichen Person.20 Obwohl die DS-GVO nach wohl herrschender Ansicht die Begriffe »Daten« und »Informationen« synonym verwendet,21 bestehen wesentliche Unterschiede zwischen den Termini:22 Eine Information kann ihr Empfänger mit einer bestimmten Bedeutung versehen, weshalb sie einen Eindruck bei ihm hinterlässt.23 Ein Datum hingegen kann eine Information lediglich dergestalt verkörpern, dass sie einer Kenntnisnahme durch den Empfänger sowie einer Verarbeitung zugänglich ist.24 Das folgende Beispiel verdeutlicht das Zusammenspiel von Datum und Information: Schicken Sie ein Bild an Ihre Familie, das Sie vor dem Eiffelturm zeigt, ist das Bild an sich ein Datum. Schaut sich Ihre Familie das Bild an, ergibt sich daraus für sie eine bestimmte Information, nämlich dass Sie irgendwann in Paris waren. Ob ein Datum personenbezogen ist, lässt sich also nur anhand der Information bestimmen, die durch das Datum repräsentiert wird.25
Versucht man, den Begriff der Information den drei Dimensionen Syntaktik, Semantik und Pragmatik26 zuzuordnen, wird deutlich, dass die DS-GVO als personenbezogene Daten nur die Informationen auf der semantischen und pragmatischen Ebene ansieht: Die syntaktische Ebene hat Zeichen zum Gegenstand (v.a. Nullen und Einsen),27 auf der semantischen Ebene erhalten die Zeichen einen eigenen Bedeutungsgehalt (aus Zeichen werden Wörter),28 und die dritte Ebene wird als Pragmatik bezeichnet, weil dort die Information mit dem verfolgten Ziel in Beziehung gesetzt wird.29 Aus den Nullen und Einsen (Syntaktik) allein kann sich keine Information ergeben, sondern erst aus der semantischen oder der pragmatischen Ebene.30 Auf der syntaktischen Ebene kann es sich also nur um Daten handeln, auf der semantischen und pragmatischen Ebene dagegen auch um Informationen. Dass die DS-GVO personenbezogene Daten als Informationen mit einer bestimmten Eigenschaft definiert, verdeutlicht, dass sie nicht trennscharf zwischen den Begriffen differenziert.31 Aus dem Umstand, dass die DS-GVO den Begriff der Daten synonym für Informationen verwendet,32 ist demnach abzuleiten, dass nur Daten, die mindestens eine semantische Ebene enthalten, personenbezogene Daten i.S.d. DS-GVO sein können.
b) »[D]ie sich auf eine identifizierte oder identifizierbare natürliche Person […] bezieh[t]«
Identifiziert ist eine natürliche Person, falls sich das Datum direkt auf sie bezieht, also das Datum selbst, ohne Hinzuziehung weiterer Mittel, die Identität der betroffenen Person offenbart.33 Eine Information bezieht sich auf eine identifizierbare natürliche Person, wenn sie direkt oder indirekt, insbesondere mittels Zuordnung zu einer bestimmten Kennung oder zu einem oder mehreren besonderen Merkmalen, die Ausdruck der Identität dieser natürlichen Person sind, identifiziert werden kann, Art. 4 Nr. 1 DS-GVO. Um festzustellen, ob eine natürliche Person identifizierbar ist, sollten nach Erwägungsgrund (ErwGr.) 26 Satz 3 DS-GVO alle Mittel berücksichtigt werden, die von dem Verantwortlichen oder einer anderen Person nach allgemeinem Ermessen wahrscheinlich genutzt werden, um die natürliche Person direkt oder indirekt zu identifizieren. Bei der Feststellung, ob Mittel nach allgemeinem Ermessen wahrscheinlich zur Identifizierung der natürlichen Person genutzt werden, sollten alle objektiven Faktoren, wie die Kosten der Identifizierung und der dafür erforderliche Zeitaufwand, herangezogen werden, wobei die zum Zeitpunkt der Verarbeitung verfügbare Technologie und technologische Entwicklungen zu berücksichtigen sind, vgl. ErwGr. 26 Satz 4 DS-GVO.
2. KI als personenbezogenes Datum i.S.d. DS-GVO?
Denkbar ist, dass bei Bestehen der Löschungsverpflichtung des Verantwortlichen neben den personenbezogenen Trainingsdaten auch die mit ihnen trainierte KI umfasst ist. Von entscheidender Bedeutung für die Beantwortung der Frage ist damit, ob die KI selbst als personenbezogenes Datum angesehen werden kann. Eine KI ist nur als ein personenbezogenes Datum zu qualifizieren, falls die zuvor genannten Voraussetzungen vorliegen. Schon die Frage nach dem Bestehen einer Information bereitet Probleme: Unterscheidet man konsequent zwischen den verschiedenen Dimensionen des Informationsbegriffs, erfasst die DS-GVO nur solche Daten, denen ein Mensch einen Bedeutungsgehalt entnehmen kann (semantische Ebene).34
Der Algorithmus einer KI verarbeitet hingegen lediglich bestimmte Daten, nicht aber Informationen:35 Die KI ist nur dazu in der Lage, eine Rechenoperation mit den eingespeisten Daten zu vollziehen.36 Ferner besteht eine KI zwar aus einem Algorithmus, also einer bestimmten Zahlenfolge, einen für sich allein stehenden Bedeutungsgehalt enthält sie jedoch nicht. Der Algorithmus kann selbst keine Information vermitteln, sondern benötigt dafür bestimmte Daten. Erst dadurch, dass diese eingegeben werden, errechnet die KI neue Daten, die sie ausgibt und die der Empfänger seinerseits mit einem Bedeutungsgehalt versehen kann. Diese Output-Daten wiederum können Informationen darstellen, die entweder personenbezogen oder nicht personenbezogen sind.37 Ohne Input-Daten fehlt es am Output: Betrachtet man nur den Algorithmus, handelt es sich schlicht um eine (komplexe) mathematische Formel38 (syntaktische Ebene). Weil es der Personenbezug des Datums aber erfordert, dass sich die Information von sich heraus auf eine Person bezieht (semantische Ebene),39 ist jedenfalls der Algorithmus keine auf eine natürliche Person bezogene Information.40
Vielmehr handelt es sich bei einer KI um ein Mittel i.S.d. ErwGr. 26 Satz 3 DS-GVO, das verwendet werden kann, um Daten einen personenbezogenen Bedeutungsgehalt zu verleihen. Das beweisen folgende Angriffe auf KI-Systeme:41 Bei der sog. »Membership-Inference-Attack« ist es möglich, aus der Eingabe eines (personenbezogenen) Datums in den Algorithmus darauf zu schließen, ob das (personenbezogene) Datum Teil des Trainingsdatensatzes einer KI war.42 Anschaulich macht das erneut das obige Beispiel: Ist eine Gesichtserkennungssoftware auch mit Ihrem Foto vor dem Eiffelturm trainiert worden, wird die Eingabe desselben Bildes in die KI zu dem Ergebnis führen, dass entweder eine Übereinstimmung von 100 % oder sogar Ihr Name als Output-Datum angegeben wird.43 Ohne das Input-Datum (Ihr Foto vor dem Eiffelturm) kommt es aber nicht zum Output-Datum (Ihr Foto ist für die Gesichtserkennungssoftware genutzt worden). Betrachtet man also den Algorithmus allein, ergibt sich aus ihm keine Information, die einen Bezug zu einer natürlichen Person enthält.44
Die sog. »Model-Inversion-Attack« erlaubt es Dritten hingegen, von einzelnen vorher bekannten Daten über die betroffene Person auf andere Daten über die betroffene Person zu schließen, die Teil des Trainingsdatensatzes waren.45 Konkret: Während bei der Membership-Inference-Attack also das Trainingsdatum dem Angreifer bekannt ist, kann es bei der Model-Inversion-Attack allein deshalb aus der KI herausgefiltert werden, weil dem Angreifer andere personenbezogene Daten der betroffenen Person bekannt sind. Demzufolge lassen einige KI-Systeme Rückschlüsse auf die verwendeten personenbezogenen Daten zu.46 Aus datenschutzrechtlicher Sicht zeigt sich aber kein Unterschied: Ohne Input-Daten kann auch hier nicht auf die personenbezogenen Output-Daten geschlossen werden. Festzuhalten ist also: Eine KI selbst ist jedenfalls kein personenbezogenes Datum, sein In- und sein Output kann hingegen durchaus ein solches darstellen.
IV. Erstreckt sich die Löschungspflicht auch auf die »Früchte« der Verarbeitung?
Jedoch hat der Verantwortliche in dem Fall, dass er die personenbezogenen Daten zum Trainieren einer KI genutzt hat, Vorteile aus der Verwendung der personenbezogenen Daten gezogen. Im Vergleich zum Ausgangszustand ist die trainierte KI eine »Frucht«, die der Verantwortliche nur aufgrund der Datenverarbeitung erlangen konnte. Demnach stellt sich die Frage, ob Art. 17 Abs. 1 Buchst. a–f DS-GVO dahingehend verstanden werden kann, dass nicht nur die personenbezogenen Daten, sondern auch die trainierte KI als solche von der Löschungspflicht des Verantwortlichen umfasst ist. Ist mit anderen Worten der Erhalt des Verarbeitungsvorteils durch Art. 17 DS-GVO gefährdet? Das soll im Folgenden durch die Auslegung der Vorschrift beantwortet werden, wobei beachtet wird, dass die Interpretation der Wendung »sie betreffende[n] personenbezogene[n] Daten« unabhängig von Erwägungen des mitgliedstaatlichen Rechts zu erfolgen hat.47
1. Löschungsgegenstand nach dem Wortlaut
Nach seinem Wortlaut umfasst Art. 17 Abs. 1 DS-GVO das Recht der betroffenen Person, die Löschung sie betreffender personenbezogener Daten zu verlangen, und die Pflicht des Verantwortlichen, die entsprechenden Daten unverzüglich zu löschen. Als Gegenstand der Löschung, auf den es für die grammatische Auslegung ankommt, nennt Art. 17 Abs. 1 DS-GVO die sie – die betroffene Person – betreffenden personenbezogenen Daten. Aus der Wendung »sie betreffende personenbezogene Daten« ist abzuleiten, dass der Verantwortliche seine Löschpflicht nur dadurch erfüllen kann, dass er alle Daten der betroffenen Person, auf die sich die Löschungspflicht bezieht, mit Sicherheit erfasst. Erforderlich ist also, dass er die Dateien mit potenziell personenbezogenen Daten darauf prüft, welche Informationen der betroffenen Person nach allgemeinem Ermessen wahrscheinlich zugeordnet werden können. Ganze Datensätze können Gegenstand des Löschungsanspruchs bzw. der Löschungspflicht sein, wenn sie insgesamt als personenbezogen zu bewerten sind.
Ein solcher Fall könnte zum Beispiel vorliegen, wenn der Datensatz, der einzelne personenbezogene Daten der betroffenen Person enthält, derart unstrukturiert ist, dass sich in ihm nicht zweifelsfrei alle Daten identifizieren lassen, die Rückschlüsse auf die betroffene Person zulassen.48 Kann der Verantwortliche nicht gewährleisten, dass sich im restlichen Datenbestand noch weitere vom Löschungsanspruch erfasste Daten befinden könnten, ist der gesamte Datenbestand »infiziert«. Denn der umfassenden Löschungspflicht kann der Verantwortliche in diesem Fall nur gerecht werden, wenn er den gesamten Datenbestand beseitigt. Weitere Daten, die mit den personenbezogenen Daten bloß in Beziehung stehen, hat er dem Wortlaut nach nicht zu entfernen. Vorteile, die der Verantwortliche kraft der Verarbeitung der personenbezogenen Daten erlangt hat, wie den Lernfortschritt der KI, nennt die Vorschrift nicht ausdrücklich als Gegenstand der Löschungspflicht.
2. Effet utile nur durch besonderen Schutz der betroffenen Person?
Besondere Bedeutung kommt bei der Interpretation des Unionsrechts nach Ansicht des EuGH der teleologischen Auslegung und dabei insbesondere dem effet utile zu.49 Der effet utile-Grundsatz verpflichtet die Mitgliedstaaten dazu, alle erforderlichen Maßnahmen zu ergreifen, um dem europäischen Recht die größtmögliche Wirksamkeit zu verleihen.50 Art. 17 DS-GVO wird nur dann die größtmögliche Wirksamkeit zuteil, wenn seine Auslegung das mit der Norm verfolgte Ziel möglichst effektiv zur Geltung bringt.51 Zu welchem Zweck die Norm in Kraft getreten ist, entnimmt der EuGH in erster Linie den Erwägungsgründen.52
Die DS-GVO soll dem Schutz der betroffenen Person dienen und gewährleisten, dass ihre Grundrechte und Grundfreiheiten bei der Verarbeitung ihrer personenbezogenen Daten gewahrt bleiben, vgl. ErwGr. 2 Satz 1 DS-GVO. ErwGr. 65 Satz 2 DS-GVO bestimmt speziell für das Recht auf Löschung gem. Art. 17 DS-GVO, dass die betroffenen Personen einen Anspruch darauf haben sollen, dass ihre personenbezogenen Daten gelöscht und nicht mehr verarbeitet werden, wenn einer der Löschungsgründe der Buchstaben a, b oder d vorliegt. Für den letztgenannten Löschungsgrund der unrechtmäßigen Datenverarbeitung könnte aus dem Erwägungsgrund abzuleiten sein, dass der betroffenen Person gerade in diesem Fall ein besonders weitreichender Löschungsanspruch zustehen muss: Der Verantwortliche würde von der rechtswidrigen Datenverarbeitung profitieren, ohne dass es dafür einen rechtlichen Grund gäbe. Er käme in den Genuss einer trainierten KI, obwohl das Training rechtswidrig war. Das könnte dafür sprechen, neben den personenbezogenen Daten auch die trainierte KI als Verarbeitungsergebnis zum Gegenstand der Löschung zu erklären.
Dagegen sprechen jedoch die sonstigen Löschungsgründe des Art. 17 Abs. 1 DS-GVO: Hier erfolgte die Verarbeitung zunächst rechtmäßig und muss erst mit Eintritt des Löschungsgrundes beendet werden. Dass der Verantwortliche um die Früchte seiner vormals rechtmäßigen Datenverarbeitung gebracht wird, ist zum Schutz der betroffenen Person nicht erforderlich: Der (un-)trainierten KI fehlt der Personenbezug. Dass der Löschungsanspruch nicht zurückwirkt, zeigt die Pflicht zur Löschung nach Widerruf der Einwilligungserklärung: Die betroffene Person hat selbst die Datenerhebung und -nutzung legitimiert und freiwillig über die Verarbeitung ihrer personenbezogenen Daten entschieden. Die Datennutzung vor dem Widerruf der Einwilligungserklärung bleibt rechtmäßig und muss nicht rückwirkend beseitigt werden.
Es ist nicht ersichtlich, dass Art. 17 Abs. 1 DS-GVO wegen des Löschungsgrundes des Buchstaben d nur dann größtmögliche Wirksamkeit erlangt, sofern in jedem Fall auch das Verarbeitungsergebnis Gegenstand der Rechtsfolge ist, insbesondere weil der Löschungsgrund des Buchstaben d nicht mit einer herausgehobenen Stellung versehen ist: Obwohl es sich dem Anschein nach um den naheliegendsten Fall einer Löschungspflicht handelt, ist er erst an vierter Stelle genannt. Selbst wenn die Datenverarbeitung rechtswidrig erfolgte und der Verantwortliche gem. Art. 17 Abs. 1 Buchst. d DS-GVO zur Löschung verpflichtet ist, kann das Verarbeitungsergebnis nur von der Rechtsfolge des Art. 17 Abs. 1 DS-GVO erfasst sein, falls es selbst ein die betroffene Person betreffendes personenbezogenes Datum darstellt. Das ist bei der KI allerdings – wie bereits erläutert – nicht der Fall.
3. Unterschied zwischen Löschung und Vernichtung
In systematischer Hinsicht könnte für den Umfang des Löschungsanspruchs Art. 4 Nr. 2 DS-GVO von Bedeutung sein. Dort werden das Löschen und die Vernichtung personenbezogener Daten als Verarbeitungen i.S.d. DS-GVO genannt. Aus der Unterscheidung zwischen Löschung und Vernichtung wird abgeleitet, dass die Vernichtung personenbezogener Daten weiter reicht als die Löschung.53 Entscheidender Unterschied zwischen der Löschung und der Vernichtung personenbezogener Daten sei die Weiternutzung vormals personenbezogener und nun anonymisierter Daten:54 Der Löschungspflicht kann der Verantwortliche nach überwiegender Ansicht genügen, indem er den Personenbezug der Daten aufhebt.55 Es reiche aus, wenn er ein Verfahren anwende, das die Identifizierbarkeit der betroffenen Person nur noch unter unverhältnismäßigem Aufwand erlaube.56 Die Vernichtung personenbezogener Daten kann man im Gegensatz dazu als einen Vorgang verstehen, der eine Weiterverarbeitung der Daten vollständig unmöglich macht.57 Daraus könnte sich ergeben, dass nur in den Fällen, in denen die DS-GVO die Vernichtung personenbezogener Daten anordnet, dem Verantwortlichen sämtliche Vorteile aus der Verwendung des personenbezogenen Datums genommen werden müssen.
Die aufgestellte Hypothese lässt sich jedoch nicht bestätigen: Unabhängig davon, ob ein Unterschied zwischen der Löschung und der Vernichtung dahingehend anzunehmen ist, dass nur die Vernichtung die Möglichkeit zur Weiterverarbeitung der (ggf. auch anonymisierten) Daten verbietet, hat die Unterscheidung für die entwickelte KI keine Bedeutung. Wird die KI weiterhin genutzt, stellt das keine Weiterverarbeitung der (ursprünglich) personenbezogenen Daten dar. Vielmehr wird lediglich ein Algorithmus auf (wie auch immer zu qualifizierende) Daten angewendet. Die systematische Auslegung hilft also hier nicht weiter, um zu bestimmen, ob auch die KI von der Löschungspflicht umfasst sein kann.
4. Das Gesetzgebungsverfahren zu Art. 17 Abs. 1 DS-GVO
Im Gesetzgebungsverfahren zur DS-GVO hatte das Europäische Parlament für die Fassung des Art. 17 Abs. 1 DS-GVO noch vorgeschlagen, neben dem Anspruch der betroffenen Person gegen den Verantwortlichen auf Löschung der sie betreffenden personenbezogenen Daten und Unterlassung jeglicher weiterer Verbreitung noch einen Anspruch gegen Dritte auf Löschung aller Querverweise auf diese personenbezogenen Daten bzw. aller Kopien und Replikationen davon zu normieren.58 Auch bei einem solch weitreichenden Löschungsanspruch wäre der eben dargestellten herrschenden Meinung entsprechend eine weitere Nutzung der Daten nach Anonymisierung möglich geblieben: Der Entwurf sah nur vor, dass der Verantwortliche jegliche weitere »Verbreitung« der Daten zu unterlassen hat, nicht aber jegliche weitere »Verarbeitung«.59 Sogar der weiterreichende Löschungsanspruch umfasste nicht explizit eine Pflicht des Verantwortlichen, die durch die Verarbeitung der personenbezogenen Daten erlangten Vorteile zu beseitigen.
5. Ergebnis der Auslegung des Art. 17 Abs. 1 DS-GVO
Art. 17 Abs. 1 DS-GVO verpflichtet den Verantwortlichen, personenbezogene Daten unverzüglich zu löschen. Neben dem Wortlaut, der sich ausdrücklich auf die »sie betreffenden personenbezogenen Daten« beschränkt, streiten auch Sinn und Zweck des Art. 17 Abs. 1 DS-GVO für eine Beschränkung des Löschungsumfangs auf die personenbezogenen Daten. Das Verarbeitungsergebnis trotz eines fehlenden Personenbezugs zum Gegenstand der Löschungspflicht zu erklären, widerspricht der Ausrichtung der DS-GVO, die der europäische Gesetzgeber nur zum Schutz personenbezogener Daten und den Gefahren ihrer Verarbeitung beschlossen hat. Art. 17 Abs. 1 DS-GVO zielt nicht auf einen Bereicherungsausgleich nach unrechtmäßiger Datenverarbeitung durch den Verantwortlichen. Ist das Verarbeitungsergebnis nicht als personenbezogenes Datum zu klassifizieren, ist es auch nicht vom Löschungsanspruch erfasst. Die systematische und genetische Auslegung des Art. 17 Abs. 1 DS-GVO können dieses Ergebnis zwar nicht bestätigen, deuten aber in dieselbe Richtung.
V. Fazit: Kein Anspruch auf Löschung der KI aus Art. 17 Abs. 1 DS-GVO
Art. 17 Abs. 1 DS-GVO verpflichtet den Verantwortlichen bei Vorliegen eines der Löschungsgründe nach vorheriger Verarbeitung personenbezogener Daten also zur Löschung dieser Daten und zur Löschung des Verarbeitungsergebnisses nur, soweit sich Daten und Ergebnis selbst als personenbezogene Daten darstellen. Die Auslegungsergebnisse verdeutlichen, dass der Löschungsanspruch nicht die KI selbst umfasst, die erst durch das Training mit personenbezogenen Daten angelernt werden konnte, weil sie kein personenbezogenes Datum i.S.d. DS-GVO ist. Dieser Umstand entbindet den Verantwortlichen jedoch nicht von der Pflicht, beim ML ein ausreichend hohes Schutzniveau für die Daten der betroffenen Person(en) sicherzustellen. Als Mittel dazu werden sog. Privacy Enhancing Technologies (PET) genannt, wie etwa Differential Privacy, die Secure Multiparty Computation, die homomorphe Verschlüsselung oder das föderierte Lernen.60 Ebenso ist eine fortlaufende Risikoanalyse geboten: Der Verantwortliche muss die technischen Entwicklungen im Auge behalten und vor allem bei sensiblen Trainingsdaten, die unter Art. 9 DS-GVO fallen, die Schutzmaßnahmen individuell anpassen.61
Mehr zum Thema
Dieser Beitrag ist Teil unserer Fachzeitschrift ZdiW – Zeitschrift für das Recht der digitalen Wirtschaft. Wenn Sie weitere spannende Beiträge lesen möchten, testen Sie jetzt kostenlos 2 Ausgaben der ZdiW. Praxisnahe Fragestellungen werden in den Rubriken Industrie 4.0, E-Commerce, Digital Finance, Digital HR und M & A/Corporate digital aufgegriffen. Es wird erläutert welche Folgen sich aus neuen technischen Möglichkeiten und rechtlichen Vorgaben für die Beratungs- bzw. Spruchpraxis ergeben. Jetzt kostenlos testen. * Simon Marx und Alicia Sütthoff sind Wissenschaftliche Mitarbeiter:innen am Institut für Staats-, Verwaltungs- und Wirtschaftsrecht (ISVWR) der Universität Osnabrück. Der Autor Marx ist für das vom BMWK geförderte Projekt Agri-Gaia tätig, die Autorin Sütthoff für das vom BMDV geförderte Projekt 5G Nachhaltige Agrarwirtschaft.
1 Europäische Kommission, COM(2018)237, S. 1; siehe dazu auch Marx DVBl 2020, 488, 488 f.; Zech ZfPW 2019, 198, 204.
2 Siehe dazu Hähnchen/Schrader/Weiler/Wischmeyer JuS 2020, 625, 625 ff.; Schicker, Legal Tech – Einblicke und Ausblicke in die neuen Technologien für Kanzleien, in: Schieblon, Kanzleimanagement in der Praxis, 4. Aufl. 2019, S. 220; Wagner, Legal tech und legal robots, 2. Aufl. 2020, S. 60.
3 Rolnick/Donti/Kaack et al., Tackling Climate Change with Machine Learning, S. 10.
4 Vgl. etwa Härtel NuR 2020, 439, 444; Martinez AUR 2016, 401, 405; Siems/Repka ZdiW 2021, 363, 363; Wilde-Detmering InTer 2019, 174, 175 f.
5 Siehe dazu etwa Härtel NuR 2020, 439, 444 f.
6 Der Autonomiegrad differiert je nach Modell, vgl. Niederée/Nejdl, Technische Grundlagen der KI, in: Ebers/Heinze/Krügel et al., Künstliche Intelligenz und Robotik, 1. Aufl. 2020, Rn. 114.
7 Datatilsynet, Artificial intelligence and privacy, 2018, S. 5; Datenethikkommission, DEK-Empfehlungen-KI-Strategie, 2018, S. 1; Drexl/Hilty/Beneke et al., Technical Aspects of Artificial Intelligence: An Understanding from an Intellectual Property Perspective, Vers. 1.0 2019, S. 3; Ege, Einblick in die Welt der künstlichen Intelligenz, in: Ege/Paschke, Semantische Datenintelligenz im Einsatz, 2021, S. 2; Guggenberger NVwZ 2019, 844, 845; Moring, KI im Job, 2021, S. 26 f.; Oster JZ 2021, 167, 173.
8 Drexl/Hilty/Beneke et al. (s.Fn.7), S. 4; Koul, Machine learning and deep learning in agriculture, in: Patel, Smart agriculture, 2021, S. 2.
9 Drexl/Hilty/Beneke et al. (s. Fn. 7), S. 3; Ege (s. Fn. 7), S. 8; Koul (s. Fn. 8), S. 2; siehe am Beispiel des autonomen Fahrens Müller ZdiW 2022, 22, 23.
10 Siehe zu den geläufigsten ML-Methoden »supervised learning«, »unsupervised learning« und »reinforcement learning« Ege (s. Fn. 7), S. 5; Hoppe, Technische Grundlagen, in: Hartmann, KI und Recht kompakt, 1. Aufl. 2020 S. 9 ff.; Kaulartz/Braegelmann/Kaulartz, Rechtshandbuch AI und ML, 1. Aufl. 2020 Kap. 2.2 Rn. 16–25; Koul (s. Fn. 8), S. 2 f.; Niederée/ Nejdl (s. Fn. 6), Rn. 39 ff.
11 Ausführlich dazu Moring (s. Fn. 7), S. 28 ff.
12 Datatilsynet (s. Fn. 7), S. 14; eine Grafik ist dazu zu finden bei Ege (s. Fn. 7), S. 7; zur Funktion neuronaler Netze vgl. Ertel, Grundkurs Künstliche Intelligenz, 5. Aufl. 2021, S. 3; Höpfner/Daum ZfA 2021, 467, 471.
13 Apel/Kaulartz RDi 2020, 24 Rn. 5; Moring (s. Fn. 7), S. 28, 34.Mitteilung der EU-Kommission – Digitaler Kompass 2030: der europäische Weg in die digitale Dekade v. 09.03.2021, COM(2021) 118 final.
14 Datatilsynet (s. Fn. 7), S. 14; Höpfner/Daum ZfA 2021, 467, 471; Kaulartz/Braegelmann/Stiemerling (s. Fn. 10), Kap. 2.1 Rn. 22.
15 Drexl/Hilty/Beneke et al. (s. Fn. 7), S. 13; Ege (s. Fn. 7), S. 6.
16 Kaulartz/Braegelmann/Stiemerling (s. Fn. 10), Kap. 2.1 Rn. 23.
17 Drexl/Hilty/Beneke et al. (s. Fn. 7), S. 4.
18 Drexl/Hilty/Beneke et al. (s. Fn. 7), S. 5; Höpfner/Daum ZfA 2021, 467, 471.
19 Der Verständlichkeit halber wird im Folgenden nur noch von der Pflicht des Verantwortlichen gesprochen, die personenbezogenen Daten der betroffenen Person löschen zu müssen.
20 Art. 29-Datenschutzgruppe, Stellungnahme 4/2007, S.7; Kühling/Buchner/Klar/Kühling, DS-GVO BDSG, 3. Aufl. 2020, Art.4 Abs. 1 Rn. 8.
21 Siehe dazu nur Albrecht/Jotzo, Das neue Datenschutzrecht der EU, 1. Aufl. 2017, Teil 3 Rn. 3; Simitis/Hornung/Spiecker gen. Döhmann/Karg, Datenschutzrecht, 1. Aufl. 2019, Art. 4 Nr. 1 Rn. 25 f.; Kühling/Buchner/Klar/Kühling (s. Fn. 20), Art. 4 Abs. 1 Rn. 8; Sydow/Ziebarth, Europäische Datenschutzgrundverordnung, 2. Aufl. 2018, Art. 4 Rn. 8.
22 Specht CR 2016, 288, 290.
23 Hildebrandt Mod. L. Rev. 2016, 1, 19; Oster JZ 2021, 167, 168; Specht CR 2016, 280, 290.
24 ISO/IEC 2382:2015, 2121272; Oster JZ 2021, 167, 168; Specht CR 2016, 288, 290.
25 Oster JZ 2021, 167, 168; Specht CR 2016, 288, 290.
26 Wiebe AUR 2021, 128, 133.
27 Adam NJW 2020, 2063 Rn. 6; Stöhr ZIP 2016, 1468, 1468; Zech CR 2015, 137, 138.
28 Vgl. Adam NJW 2020, 2063 Rn. 9.
29 Oster JZ 2021, 167, 170; Wiebe AUR 2021, 128, 133.
30 Oster JZ 2021, 167, 170.
31 Oster JZ 2021, 167, 170 f.; Sydow/Ziebarth (s. Fn. 21), Art. 4 Rn. 8.
32 Oster JZ 2021, 167, 171; Schwartmann/Jaspers/Thüsing/Kugelmann/Schwartmann/Mühlenbeck, DS-GVO/BDSG, 2. Aufl. 2020, Art. 4 Rn. 26 f.; Sydow/Ziebarth (s. Fn. 21), Art. 4 Rn. 8; a.A. Specht CR 2016, 288, 290.
33 Eckhardt DuD 2021, 107, 109; Gola/Gola, Datenschutz-Grundverordnung, 2. Aufl. 2018, Art. 4 Rn. 4.
34 Kostsoglou JZ 2014, 451, 454; Oster JZ 2021, 167, 170; vgl. auch Specht CR 2016, 288, 290.
35 Vgl. Kostsoglou JZ 2014, 451, 454: Sinn und Bedeutung des gelieferten Inputs für den Computer unbedeutend.
36 Oster JZ 2021, 167, 173 f.
37 Vgl. Cabral EDPL 2020, 378, 386.
38 Kaulartz/Braegelmann/Kaulartz (s. Fn. 10), Kap. 2.2 Rn. 4 f.; vgl. auch Shintre/Roundy/Dhaliwal, Making Machine Learning Forget, in: Naldi/Italiano/Rannenberg et al., Privacy Technologies and Policy, 2019, S. 77.
39 Siehe dazu Kühling/Buchner/Klar/Kühling (s. Fn. 20), Art. 4 Abs. 1 Rn. 12.
40 I.E. auch Veale/Binns/Edwards Phil. Trans. R. Soc. A 2018, 1, 3 f.
41 A.A. Kaulartz/Braegelmann/Kaulartz (s. Fn. 10), Kap. 8.9 Rn. 11 f.; Shintre/Roundy/Dhaliwal (s. Fn. 38), S. 73.
42 Cabral EDPL 2020, 378, 385; Kaulartz/Braegelmann/Kaulartz (s. Fn. 10), Kap. 8.9 Rn. 11.
43 Vgl. auch bei Al-Rubaie/Chang IEEE Security & Privacy 2019, 49, 52; Kaulartz/Braegelmann/Kaulartz (s. Fn. 10), Kap. 8.9 Rn. 11; Shintre/Roundy/Dhaliwal (s. Fn. 38), S. 75; Veale/Binns/Edwards Phil. Trans. R. Soc. A 2018, 1, 4 ff.; Winter/Battis/Halvani ZD 2019, 489, 492.
44 I.E. auch Chibanguza/Kuß/Steege/Steege/Kuß, KI, 1. Aufl. 2022, § 2 Rn. 78.
45 Kaulartz/Braegelmann/Kaulartz (s. Fn. 10) Kap. 8.9 Rn. 12; Veale/Binns/Edwards Phil. Trans. R. Soc. A 2018, 1, 5 f.
46 Kaulartz/Braegelmann/Kaulartz (s. Fn. 10) Kap. 8.9 Rn. 10; Shintre/Roundy/Dhaliwal (s. Fn. 38), S. 75; Veale/Binns/Edwards Phil. Trans. R. Soc. A 2018, 1, 2.
47 Vgl. EuGH 01.10.2019, C-673/17 – Planet49, Rn. 47; 26.03.2019, C-129/18 – SM, Rn. 50.
48 S. dazu Keppeler/Berning ZD 2017, 314, 317 f.; Zu den damit verbundenen Haftungsrisiken Schuster/Hunzinger CR 2017, 141, 147.
49 Vgl. etwa EuGH 04.12.1974, C-41/74 – van Duyn, Rn. 12; 01.02.1977, C-51/76 – Nederlandse Ondernemingen, Rn. 20, 29; st. Rspr.
50 St. Rspr. seit EuGH 08.04.1976, C-48/75 – Royer, Rn. 69, 73; vgl. Pechstein/Nowak/Häde/Franzius, Frankfurter Kommentar EUV, GRC, AEUV, 2017, Art. 4 EUV Rn. 115; Becker/Hatje/Schoo et al./Hatje, EU‑Kommentar, 4. Aufl. 2019, Art. 4 EUV Rn. 40.
51 Calliess/Ruffert/Wegener, EUV/AUEV, 6. Aufl. 2022, Art. 19 EUV Rn. 32.
52 St. Rspr. seit EuGH 17.06.1971, C-3/71 – Bagusat, Rn.5; vgl. speziell zum Datenschutzrecht EuGH 06.10.2015,C-362/14 – Schrems I, Rn. 46.
53 Eßer/Kramer/von Lewinski/Stollhoff, Auernhammer DSGVO, 7. Aufl. 2020, Art. 17 Rn. 9: Löschen »ein minus [sic] zur Vernichtung«; Gola/Nolte/Werkmeister (s. Fn. 33), Art. 17 Rn. 10: »Vernichtung ein Mehr zur Löschung«.
54 BfDI, Positionspapier zur Anonymisierung unter der DS-GVO, 29.06.2020, S. 9; Stürmer ZD 2020, 626, 628.
55 Hornung/Hofmann JZ 2013, 163, 164; Stürmer ZD 2020, 626, 630; Taeger/Gabel/Meents/Hinzpeter, DSGVO – BDSG – TTDSG, 4. Aufl. 2022, Art. 17 Rn. 75; a.A. Roßnagel ZD 2021, 188, 192.
56 Stürmer ZD 2020, 626, 630.
57 Kühling/Buchner/Herbst (s. Fn. 20), Art. 4 Nr. 2 Rn. 37; Simitis/Hornung/Spiecker gen. Döhmann/Roßnagel (s. Fn. 21), Art. 4 Nr. 2 Rn. 33; Stürmer ZD 2020, 626, 628; Sydow/Reimer (s. Fn. 21), Art. 4 Rn. 76; Roßnagel ZD 2021, 188, 189.
58 Europäisches Parlament, COM(2012)001 – C7-0025/2012 – 2012/0011 (COD); dazu ausführlich Kühling/Buchner/Herbst (s. Fn. 20), Art. 17 Rn. 7.
59 Europäisches Parlament, COM(2012)001 – C7-0025/2012 – 2012/0011 (COD).
60 Kaulartz/Braegelmann/Kaulartz (s. Fn. 10), Kap. 8.9 Rn. 14.
61 Kaulartz/Braegelmann/Kaulartz (s. Fn. 10), Kap. 8.9 Rn. 15.
Bildnachweis: Getty Images