学ぶ
Osmo、Meta Llama on AWS で香りをデジタル化し、AI コストを 200 分の 1 に削減

Osmo、Meta Llama on AWS で香りをデジタル化し、AI コストを 200 分の 1 に削減

このコンテンツはいかがでしたか?

香りのデジタル化に向けた取り組みの一環として、Osmo はクリエイティブなブリーフからフレグランスのフォーミュラを生成する AI 搭載ツールを開発しています。香りを物理的に生成しない限り結果を評価できないため、モデル開発には特有の複雑な課題があります。チームは当初、独自のフロンティアモデル API に依存していましたが、カスタマイズ性の制限、モデル所有権の欠如、高コストが障壁となり、この方法は持続不可能になりました。Meta Llama on Amazon Web Services (AWS) に移行したことで、Osmo はモデルとインフラストラクチャを完全にコントロールできるようになり、トレーニングコストを 20 分の 1、推論コストを 200 分の 1 に削減しました。熟練した調香師による評価では、同社のオープンモデルシステムは最先端のモデル同等のパフォーマンスを示しました。

人間の知覚の最後の感覚をデジタル化する

コンピューターは視覚を習得し、聴覚も習得しました。そして、人間の能力をはるかに超えるスケールと速度で、光、動き、音を検出できます。しかし、コンピューティングの歴史の大半において、ただ 1 つだけ手の届かない感覚が残っていました。それは嗅覚です。Osmo にはそれを変えようとしています。同社は機械学習、調香、化学、神経科学を組み合わせて、いわゆる「嗅覚知能」を構築し、AI システムが化学の世界を感知し解釈する能力を与えています。

現在、Osmoは主にフレグランス業界向けにサービスを提供していますが、香りをブランドストーリーテリングの媒体として使用する領域も積極的に拡大しています。Studioプラットフォームでは、ユーザーは文章、ムードボード、画像などから始めて、避けたい香りのノート、予算、クリーンな基準といったガードレールを設定します。Studio はそれらの入力を製造できるフォーミュラに変換し、物理サンプルとして顧客の手元に届けます。香りづくりの障壁を下げることで、Osmoは、フレグランスを特別な高級品から、現代のブランド表現に活用できる身近で強力なツールへと変えようとしています。

この技術の構築は、機械学習の中でも特に難易度の高い課題です。香りは極めて高次元であり、人間の鼻には視覚の 3 種類に対し、約 400 種類の受容体があります。さらに、香りの知覚は複雑な分子の組み合わせに依存します。人間による香りの記述には一貫性がなく、ラベル付けされたデータの収集も困難です。「ほとんどの AI システムとは異なり、結果を即座に評価することはできません」と Osmo の最高技術責任者、Richard Whitcomb 氏は述べています。各評価サイクルには約 2 週間要します。訓練を受けた評価者は、サンプルがインプットブリーフとどの程度一致しているかにくわえ、バランス、着用性、高級フレグランスとしての全体的な品質といった質的属性を評価します。これにより、モデルの出力と実世界の評価との間に密接に結びついたフィードバックループが形成されます。各ループには物理的な生産が必要となるため、反復には時間と費用がかかります。そのため、基盤となる AI インフラストラクチャのコスト効率と柔軟性が極めて重要になります。

Osmoは当初、大規模なフロンティアモデル API を使用してこの問題に取り組みました。しかし、同社の目指す方向が拡大するにつれ、独自プラットフォームの制約を無視できないものになってきました。トレーニング方法はプラットフォームが許容する範囲に限られ、このような高度に専門性の高い分野では、モデルの振る舞いを深くカスタマイズする機能は不可欠でした。オーナーシップも同様に重要です。ファインチューニングされたウェイトと独自のトレーニングデータが競争優位性の源泉となる領域では、Osmoがコントロールしていないモデルに依存することは次第に受け入れがたい状況になっていきました。

クローズドモデルからフルスタック AI オーナーシップへの移行

Meta Llama models on AWS により、Osmo はシステムを適切な形で構築するのに必要なコントロールと柔軟性を手に入れました。「私たちはフレグランスの創作を、文章を書くようなものだと考えています。言語モデルがテキストを生成するように、成分を一つ一つ積み上げてフォーミュラを作っていくのです」と、Osmo のエンジニアリング兼研究担当副社長である Wesley Qian 氏は述べています。「まず主要な構成要素を定め、その後に不足分を埋めていくと、モデルはデータを通してそれらのパターンを学習します」。Llama のオープンウェイトにより、Osmo はモデルの振る舞いを調整し、トレーニング手法をカスタマイズし、インフラストラクチャとモデルのコントロールを維持することで、この構造化された逐次プロセスをより適切にサポートできるようになりました。これには、Direct Preference Optimization (DPO) などの手法の実装、反復型フレグランスデザインのためのエージェント・ループの構築、Group Relative Policy Optimization (GRPO) のような強化学習アプローチの検討などが含まれていました。

このアプローチを大規模にサポートするために、Osmo は AWS で柔軟なトレーニングおよびデプロイのパイプラインを構築しました。Amazon SageMaker は独自のデータセットを用いた Osmo のトレーニングとファインチューニングのワークフローを支え、モデルのウェイトは Amazon Simple Storage Service (Amazon S3)に保存され、デプロイのために Amazon Bedrock にインポートされます。Amazon Bedrock は推論エンドポイントの自動スケーリングを提供するため、実験段階から本番環境までコスト効率の高いサービスが可能になります。「Llama on AWS に移行したことで、AI システムの構築に関する考え方が変わりました」と Whitcomb 氏は述べています。「これまで製品をモデルに合わせて調整してきましたが、モデルを製品に合わせて最適化できるようになりました」。

プロセス全体を通して、AWS チームは Osmo と緊密に連携し、毎週会合を開いてデータ準備戦略やモデル構成を評価しました。Osmo が実験段階から安定した本番パイプラインに迅速に移行できるよう、リファレンス実装、デバッグサポート、トレーニングおよび推論スクリプトも提供されました。AWS と Osmo は Meta Llama バリアントを評価した結果、Meta Llama 3.1 8B および 3.3 70B Instruct モデルが最も優れたパフォーマンスを示し、8B モデルも実行可能なアウトプットを生成できると判断しました。このコラボレーションは、Osmo が継続的にモデルを改良するプロセスにまで及びました。高パーフォーマンスのフォーミュラは、フィルタリングされた拡張ループを通して再びトレーニングに取り込まれ、成功したアウトプットのみがデータセットに追加されることで、検証された結果のみが将来のモデル生成に反映されるようになっています。「AWS が私たちにもたらしてくれたのは、トレーニングからデプロイまでを完全に理解し、コントロールできる真のエンドツーエンドのワークフローです」と Whitcomb 氏は語っています。

同等性の確保、コスト削減、そして完全なコントロール

訓練を受けた評価者による評価の結果、Meta Llama 3.3 70B モデルは、大規模なフロンティア API を基盤に構築された Osmo の本番モデルと同等のパフォーマンスを達成していることが証明されました。記述子への適合性やフレグランスの質的特性など、主要メトリクスにおいて統計的に有意な差はありませんでした。Osmo の上級機械学習エンジニアである Sam Barnett 氏は、「センサーパネルが Meta Llama 3.3 70B の出力と、はるかに大規模なフロンティアモデルの出力とを区別できなかったとき、私たちは正しい方向に進んでいると確信しました」と述べています。最も重要なのは、モデルのサイズやスループットにもよりますが、トレーニングコストが約10〜20 の 1 に、推論コストが最大 200 分の 1 にまで減少したことです。経済的に実現可能な範囲を根本的に変えるものでした。Whitcomb 氏によると、「モデルとデータのオーナーシップを維持しながら、より多くの実験を行い、より速く反復し、最終的にはお客様により良い結果を届けられるようになりました」。

独自の AI プロバイダーへの依存をなくすことで、Osmo は強制的な非推奨や予期しない動作変更といったリスクも取り除きました。「これはまさに、インテリジェンスを借りることから、自分たちで構築する段階への移行ということです。私たちが完全にコントロールし、継続的に改善できるデジタル調香師を作ることでもあります」と Whitcomb 氏は述べています。コストが削減され、完全にコントロールできるようになったことで、Osmo はより速く反復し、より多くのデータを生成し、コアモデルを改良できるようになりました。「モデルとインフラストラクチャを自分たちでコントロールできれば、制約の厳しいシステムでは不可能なアイデアにも挑戦できます」と Qian 氏は言います。これにより、嗅覚知能を視覚や聴覚のためのツールと同じように、誰もが利用でき、強力なものにするという同社の大きな使命が加速します。「機械が香りを解釈できるようになれば、腐った食品の検知や、建物内のカビの感知から、病気の検出、環境リスクの特定まで、まったく新しい応用が広がります」と Whitcomb 氏は語っています。

Amazon SageMaker と Amazon Bedrock が、生成 AI モデルを完全にコントロールしながら構築、カスタマイズ、デプロイするための新しい可能性をどのように切り開いているかをご紹介します。

このコンテンツはいかがでしたか?