メインコンテンツにスキップAWS Startups
  1. 学ぶ
  2. Privado AI、ファインチューニングされた Llama 3.1 on AWS を使用して、グローバルなプライバシーコンプライアンスの精度 90% を達成

Privado AI、ファインチューニングされた Llama 3.1 on AWS を使用して、グローバルなプライバシーコンプライアンスの精度 90% を達成

このコンテンツはいかがでしたか?

手作業による評価主導型の方法を使用して処理活動の記録 (RoPA) を管理する場合、企業は重大なリスクと業務遅延に直面します。こうした従来のアプローチでは、急速に進むソフトウェア開発に追随できず、コンプライアンス文書が不正確で古くなってしまいます。この問題に対応するため、AWS パートナーであるPrivado AI は、ファインチューニングされた Meta Llama 3.1 モデルを使用して自動化システムを開発しました。このソリューションは、ソースコードから直接データ処理経路を特定し、監査にそのまま利用できる記録を生成します。その結果、このプラットフォームの検出精度が 90% に向上し、言語間のばらつきは 5% 未満にまで減少しました。これにより、プライバシーチームは労力の 90% を、手作業のデータ収集から、より積極的なリスク軽減へと移すことが可能になりました。

手動プライバシー評価という「迷路」からの脱出

Privado AI は、企業のプライバシーチームと連携し、複雑で急速に変化するアプリケーション環境全体で正確なコンプライアンス文書を維持しています。同社のプラットフォームは、ウェブサイトやモバイルアプリにおける優先度の高い違反を特定し、データマップの作成を自動化することで、プライバシー責任者がコンプライアンスリスクを低減できるよう設計されています。顧客との取り組みを通じて、Privado AI は、従来の RoPA プロセスはしばしば時間がかかり、手作業で、かつ不正確になりがちであることを把握しました。

一般データ保護規則 (GDPR) などの枠組みの下で事業を行う組織は、個人データの収集、処理、共有の方法を文書化する必要があります。多くの企業では、エンジニアリングチームに記憶に頼りにデータフロー説明をしてもらうインタビューやアンケートに依存しています。しかし、この情報はシステム全体を完全には把握していない複数の関係者から収集されるため、結果として得られる記録は、部分的な知識や古い情報に基づいていることが少なくありません。こうした人間の記憶への依存は、文書が技術システムの実際の状態を反映しないという、重大な真実の源泉の問題を引き起こします。

エンジニアリングチームが毎日コードを出荷し、新機能をリリースするという現代のソフトウェアライフサイクルの現実によって、課題はさらに深刻になります。従来の評価主導型のアプローチでは、開発のスピードに追随できず、変更が加えられた瞬間にドキュメントが本番環境と同期しなくなってしまいます。この遅れにより、プライバシーチームは積極的なリスク管理ではなく、事後対応型のデータ収集サイクルに陥ってしまいます。監査や調査の場面では、不正確な記録があることで違反や罰金のリスクが大幅に高まります。

Privado AI のマーケティング責任者である Ben Werner 氏は次のように語っています。「これは非常に長い手動による事実調査ミッションであり、エンジニアリングチームがデータの処理方法を変えれば翌週にはすぐに時代遅れになってしまいます。完全に正確で最新の記録を常に保持することは不可能な、一種の迷路のようなものです」。

ファインチューニングした Llama 3.1 と アダプタースワッピング を AWS で活用したコンプライアンス自動化

静的評価と動的コードベースのギャップを埋めるために、Privado AI はテクニカルシグナルから直接レコードを生成するシステムを構築しました。同社が基盤として Meta Llama 3.1-8B を選択したのは、そのオープンウェイト性により、顧客の Amazon Virtual Private Cloud (Amazon VPC) 内にモデルを直接デプロイできる柔軟性があるためです。このアーキテクチャは、機密性の高いソースコードが外部のサードパーティ AI プロバイダーによって処理されるのではなく、顧客自身の環境内に留まるようにするという重要なセキュリティ要件に対応しています。さらに、Amazon Web Services (AWS) で実行することで、Privado AI は、単一の GPU で忠実度の高い結果を達成できる「スイートスポット」を見出し、技術的なパフォーマンスと費用対効果のバランスを取ることに成功しました。

ソリューションを構築する上での大きな障害は、複雑な企業コードをプライバシー分類にマッピングする既存のデータセットがないことでした。トレーニングセットを作成するために、Privado AI はマルチモデルコンセンサス戦略を採用し、匿名化された 1,000 のコード経路を複数のフロンティアモデルに通して、モデル間で一致したパターンを特定しました。このコンセンサスにより、トレーニングに関する信頼性の高い「グラウンドトゥルース」が形成されました。その後、チームは Quantized Low-Rank Adaptation (QLoRa) を適用し、Llama 3.1-8B をファインチューニングして、処理アクティビティの検出やデータ主体の分類などの専門タスクに対応できるようにしました。その際、軽量 LoRa アダプター (50~200 MB のアーティファクト) を活用しています。パフォーマンスを向上させるために、このアーキテクチャには Amazon SageMaker Large Model Inference (LMI) コンテナ経由で vLLM を組み込んでいます。これにより、連続バッチ処理や LoRa アダプターをミリ秒単位でスワップできるといった主要な機能が実現します。この「アダプタースワッピング」アプローチでは、1 つの基本モデルをロードしたまま、リクエストごとに必要に応じて必要なアダプタを切り替えることで、1 台のマシンで 9 種類以上のコンプライアンスタスクをサポートできるようになります。

プラットフォームのコンピューティング基盤には、Amazon Elastic Compute Cloud (Amazon EC2)が採用されており、高性能の GPU インスタンス全体で複雑なスキャンワークロードを管理しています。Privado AI は 6~8 時間のトレーニングウィンドウに必要な拡張メモリを確保するために G6e.xlarge インスタンスを使用し、リアルタイム推論には、コスト効率の高い G6.xlarge インスタンスを利用しています。企業のスキャン要件は断続的なものであることが多いため、Amazon MQ は非同期タスクキューを管理し、膨大なコードベースからのバーストを処理します。これにより、リソースを過剰にプロビジョニングすることなくシステムの速度を安定して維持できます。

アイドル状態のコンピューティングコストを最小限に抑えるため、Privado AI はスケールトゥゼロ推論アーキテクチャを実装しました。従来、12 GB の基本モデルのダウンロードには最大 10 分かかり、この遅延がリアルタイムでのスケーリングを困難にしていました。この課題を解決するために、チームは Amazon Elastic File System (Amazon EFS) を共有モデルキャッシュとして使用し、起動時間を約 1 分まで短縮しました。この高速化により、エンタープライズワークロードにおけるデマンドベースのスケーリングが現実的なものになりました。Amazon CloudWatch は、この容量を管理するためのモニタリングとスケーリングシグナルを提供し、処理すべきアクティブなキューがある場合にのみ、プラットフォームが Amazon EC2 で高価な GPU リソースを起動するようにします。

Privado AI の共同創業者である Prashant Mahajan 氏は「AWS チームは非常に協力的で、必要に応じて技術専門家を派遣して、既存のアーキテクチャの改善や高度な技術の試行を支援してくれました」と述べています。「私たちが実装したアイデアの中には、もともと AWS チームとのこうした深い議論から生まれたものもあります」。

労働時間を取り戻す: 作業の 90% をデータ収集からリスク軽減へシフト

Privado AI は、AWS でプライバシー自動化プラットフォームを設計することで、コンプライアンス報告のスピードと精度を根本的に変革しました。ファインチューニングされた Meta Llama 3.1-8B アーキテクチャへの移行により、技術的パフォーマンスが大幅に向上し、処理アクティビティの検出精度が 50% のベースラインから 90% の精度に向上しました。同様に、アクティビティのグループ化とデータ主体の分類も 95% の精度に達し、監査対応ドキュメントに必要な信頼性の高い詳細な情報が得られました。この高精度の出力により、監査対応ドキュメントに必要なきめ細かな詳細が提供され、プライバシーチームは徹底的な手動検証を行うことなく、自動化された結果を信頼できるようになります。

このソリューションは、単なる精度にとどまらず、これまでグローバル企業のコードベースを悩ませてきた一貫性のギャップも解消しました。 以前は、プログラミング言語によってシステムのパフォーマンスに 40% のばらつきがありましたが、Amazon EC2 での最適化後、その差は 5% 未満にまで減少しました。この言語間の信頼性と 99% の構造化 JSON コンプライアンスにより、Privado AI は結果をダウンストリームの自動化ワークフローに直接送信することができます。手作業による再フォーマットの手間を省くことで、このプラットフォームは、未加工のコードから最終的なコンプライアンスレポートまでのシームレスなデータフローを実現します。

最も大きな影響は、プライバシーチームと法務チームが経験した業務上の変化です。Privado AI は、コンプライアンスを人間の記憶ではなく技術的な現実に根付かせたことで、ユーザーの週あたりの労働時間を取り戻しました。Mahajan 氏は次のように説明しています。「以前は、プライバシーチームは時間の 90% を手作業によるデータ収集に費やしていました。今では、時間の 90% をリスクの理解と軽減に費やし、データ収集の業務には 10% しか費やしていません。」この変革により、プライバシーチームは信頼の基盤を維持しながら、急速なイノベーションのペースに遅れずに対応することができます。

AI on AWS を使用して、複雑な現実世界の課題に取り組んでみたいとお考えですか?AWS Activate はスタートアップ企業が自信を持って事業を拡大するために必要なツールとリソースを提供します。AWS Activate クレジットは、AWS インフラストラクチャ、データサービス、主要な AI および ML モデルの費用を相殺するために使用できます。本番環境のワークロードを実行する準備ができたら、柔軟な Amazon EC2 インスタンスを利用して、トレーニングと推論の両方を大規模に効率的にサポートできます。詳細については、 AWS アカウントチームにお問合せください。

このコンテンツはいかがでしたか?