Die datenschutzrechtliche Herausforderung
Large Language Models verarbeiten personenbezogene Daten in mehrfacher Hinsicht: im Training, in den Eingabeaufforderungen (Prompts), in den generierten Antworten und durch die Speicherung von Konversationsverläufen. Jede dieser Phasen unterliegt der DSGVO.[1]
Die Datenschutzkonferenz (DSK) hat im Mai 2024 eine wegweisende Orientierungshilfe veröffentlicht, die erstmals einen strukturierten Rahmen für die datenschutzrechtliche Bewertung von KI-Systemen bietet. Das zentrale Ergebnis: Der Einsatz von LLMs ist DSGVO-konform möglich — aber nur unter Einhaltung spezifischer Voraussetzungen.[2]
Für IT-Leiter bedeutet das: Ohne eine saubere datenschutzrechtliche Grundlage riskieren Sie nicht nur Bussgelder von bis zu 20 Millionen Euro oder 4 Prozent des weltweiten Jahresumsatzes, sondern auch Vertrauensverlust bei Kunden und Mitarbeitern.
Die Herausforderung liegt in der Komplexität: LLMs sind keine klassischen Datenverarbeitungssysteme. Ihre probabilistische Natur, die Undurchsichtigkeit der Trainingsdaten und die Möglichkeit, personenbezogene Daten aus dem Training zu reproduzieren, erfordern neue Bewertungsansätze.