Amazon SageMaker AI がさらに 12 のモデルでサーバーレスの強化ファインチューニングのサポートを開始

投稿日: 2026年3月25日

Amazon SageMaker AI で、さらに 12 のオープンウェイトモデルでのサーバーレスモデルのカスタマイズと強化のファインチューニングがサポートされるようになりました。これにより、インフラストラクチャのプロビジョニングや管理を行わずに、それらをファインチューニングして評価できるようになりました。新たにサポートされるモデルは、gpt-oss-120b、Qwen2.5 72B Instruct、DeepSeek-R1-Distill-Llama-70B、Qwen3 14B、DeepSeek-R1-Distill-Qwen-14B、Qwen2.5 14B Instruct、DeepSeek-R1-Distill-Llama-8B、DeepSeek-R1-Distill-Qwen-7B、Qwen3 4B、Meta Llama 3.2 3B Instruct、Qwen3 1.7B、DeepSeek-R1-Distill-Qwen-1.5B です。この拡張により、教師ありファインチューニング (SFT)、直接選好最適化 (DPO)、RLVR や RLAIF などの強化ファインチューニング (RFT) 手法を使用して、これらのモデルをカスタマイズできます。支払いは使用した分だけです。

強化ファインチューニングにより、従来の SFT などの手法だけでは不十分な、複雑でドメイン固有の推論タスクに合わせてモデルを調整できます。RLVR では、正確性に基づく報酬シグナルを提供することで、コード生成、数学、構造化抽出などの検証可能なタスクにおけるモデルの精度を向上させることができます。RLAIF は、AI が生成したフィードバックを使用して、モデルの動作を品質や安全性の選好に合わせて調整します。これらの手法は、クラスターのセットアップ、キャパシティプランニング、分散型トレーニングの専門知識を必要とせずに、以前にサポートされたモデルや新しく追加されたモデルで使用できます。

これらのモデルとファインチューニング手法は、米国東部 (バージニア北部)、米国西部 (オレゴン)、アジアパシフィック (東京)、および欧州 (アイルランド) で利用できます。使用を開始するには、Amazon SageMaker AI モデルのカスタマイズの製品ページを参照するか、Amazon SageMaker AI の 料金ページ (「Model Customization」タブ) にアクセスして、モデル、手法、価格の全リストを確認してください。