Zum Hauptinhalt springenAWS Startups
  1. Lernen
  2. Privado AI erreicht mit einem optimierten Llama-3.1-Modell in AWS eine Genauigkeit von 90 Prozent bei der Einhaltung globaler Datenschutzbestimmungen

Privado AI erreicht mit einem optimierten Llama-3.1-Modell in AWS eine Genauigkeit von 90 Prozent bei der Einhaltung globaler Datenschutzbestimmungen

Wie war dieser Inhalt?

Unternehmen sind erheblichen Risiken und betrieblichen Verzögerungen ausgesetzt, wenn sie manuelle, auf Beurteilung basierende Methoden zur Führung von Verarbeitungsprotokollen (RoPA) verwenden. Diese traditionellen Ansätze können mit der rasanten Softwareentwicklung kaum Schritt halten, was zu ungenauer und veralteter Compliance-Dokumentation führt. Um dem entgegenzuwirken, hat der AWS-Partner Privado AI ein automatisiertes System entwickelt, das durch Feinabstimmung optimierte Meta-Llama-3.1-Modelle nutzt. Diese Lösung identifiziert Datenverarbeitungswege direkt aus dem Quellcode, um auditfähige Aufzeichnungen zu generieren. Dadurch verbesserte die Plattform die Erkennungsgenauigkeit auf 90 Prozent und reduzierte sprachübergreifende Abweichungen auf weniger als 5 Prozent. Diese Ergebnisse ermöglichen es Datenschutzteams, 90 Prozent ihres Aufwands von der manuellen Datenerfassung auf die aktive Risikominderung zu verlagern.

Entkommen aus dem „Kaninchenbau“ manueller Datenschutzbeurteilungen

Privado AI arbeitet mit Datenschutzteams in Unternehmen zusammen, um eine genaue Compliance-Dokumentation in komplexen und sich schnell verändernden Anwendungsumgebungen zu gewährleisten. Die Plattform des Unternehmens soll Datenschutzverantwortlichen dabei helfen, Compliance-Risiken zu reduzieren, indem sie Verstöße mit hoher Priorität auf Websites und in mobilen Apps identifiziert und die Erstellung von Datenkarten automatisiert. Durch die Zusammenarbeit mit Kunden hat Privado AI festgestellt, dass traditionelle RoPA-Prozesse oft langsam, manuell und ungenau sind.

Unternehmen, die unter Rahmenwerken wie der Datenschutz-Grundverordnung (DSGVO) operieren, müssen dokumentieren, wie personenbezogene Daten erhoben, verarbeitet und weitergegeben werden. Für viele Unternehmen stützt sich dies auf Interviews und Fragebögen, in denen Engineering-Teams gebeten werden, Datenflüsse aus dem Gedächtnis zu beschreiben. Da die Informationen von mehreren Beteiligten gesammelt werden, denen möglicherweise kein vollständiger Überblick über das gesamte System vorliegt, basieren die daraus resultierenden Aufzeichnungen häufig auf unvollständigem oder veraltetem Wissen. Diese Abhängigkeit von menschlicher Erinnerung führt zu einem erheblichen Problem der „Source of Truth“, bei dem die Dokumentation nicht den tatsächlichen Zustand der technischen Systeme widerspiegelt.

Die Herausforderung wird durch die Realität des modernen Software-Lebenszyklus noch verstärkt, in dem Entwicklerteams täglich Code ausliefern und neue Features veröffentlichen. Traditionelle, auf Beurteilungen basierende Ansätze können einfach nicht mit der Geschwindigkeit der Entwicklung Schritt halten, was dazu führt, dass die Dokumentation in dem Moment, in dem eine Änderung umgesetzt wird, nicht mehr mit der Produktionsumgebung synchron ist. Diese Verzögerung zwingt Datenschutzteams in einen reaktiven Zyklus der Datenerfassung, anstatt proaktives Risikomanagement zu betreiben. Bei einem Audit oder einer Untersuchung erhöhen ungenaue Aufzeichnungen das Risiko von Verstößen und Geldstrafen erheblich.

Wie Ben Werner, Marketingleiter bei Privado AI, es ausdrückt: „Es handelt sich um eine sehr langwierige manuelle Ermittlung, die bereits in der Woche darauf veraltet ist, sobald die Entwicklerteams ihre Datenverarbeitungsprozesse ändern. Es ist eine Art Kaninchenbau, in dem es unmöglich ist, jederzeit über vollständig genaue und aktuelle Aufzeichnungen zu verfügen.“

Automatisierung der Compliance mit optimiertem Llama-3.1-Modell und Adapterwechsel in AWS

Um die Lücke zwischen statischen Beurteilungen und dynamischen Codebasen zu schließen, hat Privado AI ein System entwickelt, das Aufzeichnungen direkt aus technischen Signalen generiert. Das Unternehmen wählte Meta Llama 3.1-8B als Grundlage, da dessen offene Gewichtung die Flexibilität bietet, das Modell direkt innerhalb der Amazon Virtual Private Cloud (Amazon VPC) des Kunden bereitzustellen. Diese Architektur erfüllt eine entscheidende Sicherheitsanforderung: Sie stellt sicher, dass sensibler Quellcode innerhalb der eigenen Umgebung des Kunden verbleibt, anstatt von externen KI-Anbietern verarbeitet zu werden. Durch den Einsatz in Amazon Web Services (AWS) fand Privado AI einen „Sweet Spot“, an dem es mit einer einzigen GPU hochauflösende Ergebnisse erzielen und so technische Leistung mit Kosteneffizienz in Einklang bringen konnte.

Ein erhebliches Hindernis bei der Entwicklung der Lösung war der Mangel an bestehenden Datensätzen, die komplexen Unternehmenscode mit Datenschutztaxonomien verknüpfen. Um einen Trainingssatz zu erstellen, nutzte Privado AI eine Multi-Modell-Konsensstrategie, bei der 1.000 anonymisierte Code-Pfade durch mehrere Frontier-Modelle geleitet wurden, um Muster zu identifizieren, bei denen sich die Modelle einig waren. Dieser Konsens bildete ein hohes Maß an Vertrauen in die „Ground Truth“ für das Training. Anschließend wandte das Team Quantized Low-Rank Adaptation (QLoRA) an, um Llama 3.1-8B für spezielle Aufgaben wie die Erkennung von Verarbeitungsaktivitäten und die Klassifizierung von betroffenen Personen mithilfe von leichtgewichtigen LoRA-Adaptern – kompakten Artefakten von 50–200 MB – zu optimieren. Um die Leistung zu steigern, integriert die Architektur vLLM über Amazon SageMaker Large Model Inference (LMI)-Container, was wichtige Funktionen wie kontinuierliches Batching und die Möglichkeit ermöglicht, LoRA-Adapter innerhalb von Millisekunden auszutauschen. Dieser Ansatz des „Adapter-Wechsels“ ermöglicht es einer einzelnen Maschine, neun oder mehr Compliance-Aufgaben zu unterstützen, indem ein Basismodell geladen und je nach Bedarf für jede Anforderung spezifische Adapter ausgetauscht werden.

Das Rechen-Backbone der Plattform basiert auf Amazon Elastic Compute Cloud (Amazon EC2), die komplexe Scan-Workloads über hochleistungsfähige GPU-Instances hinweg verwaltet. Privado AI nutzt G6e.xlarge-Instances, um den für sechs- bis achtstündige Trainingsfenster erforderlichen erweiterten Speicher bereitzustellen, während G6.xlarge-Instances die Echtzeit-Inferenz mit optimaler Kosteneffizienz bewältigen. Da Scan-Anforderungen in Unternehmen oft episodisch auftreten, verwaltet Amazon MQ asynchrone Aufgabenwarteschlangen, um Spitzenlasten aus umfangreichen Codebasen zu bewältigen, und stellt so sicher, dass das System eine konstante Geschwindigkeit beibehält, ohne Ressourcen übermäßig bereitzustellen.

Um die Kosten für ungenutzte Rechenkapazitäten zu minimieren, implementierte Privado AI eine „Scale-to-Zero“-Inferenzarchitektur. Traditionell kann das Herunterladen eines 12-GB-Basismodells bis zu 10 Minuten dauern – eine Verzögerung, die ein Skalieren in Echtzeit unmöglich macht. Um dies zu lösen, nutzt das Team Amazon Elastic File System (Amazon EFS) als gemeinsamen Modell-Cache, wodurch die Startzeiten auf etwa eine Minute reduziert werden. Diese Geschwindigkeit macht das Bedarfs-Skalieren für Unternehmens-Workloads praktikabel. Amazon CloudWatch liefert die Überwachungs- und Skalierungssignale zur Verwaltung dieser Kapazität und stellt sicher, dass die Plattform teure GPU-Ressourcen auf Amazon EC2 nur dann hochfährt, wenn eine aktive Warteschlange zur Verarbeitung vorliegt.

„Das AWS-Team hat uns sehr unterstützt und bei Bedarf technische Experten hinzugezogen, um uns dabei zu helfen, unsere bestehende Architektur zu verbessern und fortschrittliche Techniken auszuprobieren“, sagt Prashant Mahajan, Mitbegründer von Privado AI. „Einige der Ideen, die wir umgesetzt haben, entstanden ursprünglich aus diesen intensiven Gesprächen mit dem AWS-Team.“

Die Arbeitswoche zurückgewinnen: 90 Prozent des Aufwands von der Datenerfassung auf die Risikominderung verlagern

Durch die Architektur seiner Datenschutz-Automatisierungsplattform in AWS hat Privado AI die Geschwindigkeit und Genauigkeit der Compliance-Berichterstattung grundlegend neu definiert. Der Übergang zu einer optimierten Meta Llama 3.1-8B-Architektur führte zu einem enormen Sprung in der technischen Leistung und verbesserte die Erkennung von Verarbeitungsaktivitäten von einer Grundgenauigkeit von 50 Prozent auf 90 Prozent. Ebenso erreichten die Aktivitätsgruppierung und die Klassifizierung von betroffenen Personen eine Präzision von 95 Prozent und lieferten damit die zuverlässigen, detaillierten Informationen, die für auditfähige Dokumentation erforderlich sind. Diese hochpräzisen Ergebnisse liefern die für auditfähige Dokumentation notwendigen detaillierten Informationen und stellen sicher, dass Datenschutzteams den automatisierten Ergebnissen vertrauen können, ohne eine umfassende manuelle Verifizierung durchführen zu müssen.

Über die reine Genauigkeit hinaus hat die Lösung die Konsistenzlücke geschlossen, die seit jeher die Codebasen globaler Unternehmen belastet. Zuvor wies das System eine Leistungsabweichung von 40 Prozent zwischen verschiedenen Programmiersprachen auf; nach der Optimierung auf Amazon EC2 sank diese Abweichung auf unter 5 Prozent. Diese sprachübergreifende Zuverlässigkeit, gepaart mit einer 99-prozentigen Konformität mit strukturiertem JSON, ermöglicht es Privado AI, Ergebnisse direkt in nachgelagerte AutomatisierungsWorkflows einzuspeisen. Durch den Wegfall der Reibungsverluste bei der manuellen Neuformatierung ermöglicht die Plattform einen nahtlosen Flow vom Rohcode bis hin zu den endgültigen Compliance-Berichten.

Die bedeutendste Auswirkung ist der operative Wandel, den Datenschutz- und Rechtsabteilungen erfahren haben. Indem Privado AI die Compliance auf technische Fakten statt auf menschliche Erinnerung stützt, hat es seinen Benutzern wertvolle Arbeitszeit zurückgewonnen. Mahajan erklärt: „Früher verbrachten Datenschutzteams 90 Prozent ihrer Zeit mit der manuellen Datenerfassung. Jetzt verwenden sie 90 Prozent ihrer Zeit darauf, Risiken zu verstehen und zu mindern, und nur 10 Prozent auf die Datenerfassung.“ Diese Transformation ermöglicht es Datenschutzteams, mit rasanten Innovationen Schritt zu halten und gleichzeitig eine Vertrauensbasis zu wahren.

Möchten Sie komplexe, reale Herausforderungen mit KI in AWS bewältigen? AWS Activate stattet Startups mit den Tools und Ressourcen aus, die für Vertrauen beim Skalieren erforderlich sind. AWS Activate-Guthaben können verwendet werden, um die Kosten für AWS Infrastruktur, Datendienste sowie führende KI- und ML-Modelle zu decken. Wenn Sie bereit sind, Produktions-Workloads auszuführen, ermöglichen flexible Amazon EC2 -Instances ermöglichen es Ihnen, sowohl Training als auch Inferenz auf großem Maßstab effizient zu unterstützen. Wenden Sie sich an das AWS-Kundenteam, um weitere Informationen zu erhalten.

Wie war dieser Inhalt?