Amazon ElastiCache で、ベクトルと全文のリアルタイムハイブリッド検索のサポートを開始
Amazon ElastiCache では、個別の検索サービスなしで、1 回のクエリでベクトル類似性検索と全文検索を組み合わせたリアルタイムのハイブリッド検索がサポートされるようになりました。アプリケーションでは、セマンティックな意味と、意図および正確な用語の両方を取得する正確なキーワードマッチングを組み合わせることで、どちらかの方法を単独で行う場合よりも関連性の高い結果を得ることができます。お客様は ElastiCache を使用して、Amazon Bedrock、Amazon SageMaker、Anthropic、OpenAI などの人気プロバイダーが提供する何十億もの埋め込みに対して全文検索とベクトル類似性検索を組み合わせて、マイクロ秒単位の低いレイテンシーと最大 99% の再現率を実現できます。
ElastiCache では、書き込みが完了するとすぐにデータを検索できるため、アプリケーションは常に最新のベクトルとテキストを検索できます。開発者はハイブリッド検索を使用して AI エージェントメモリと RAG システムを構築できます。RAG システムでは、正確な用語と意味を使用して関連するコンテキストを検索し、トークンのコストを削減しながら生成 AI の回答を改善できます。e コマースやストリーミングプラットフォームでは、ユーザーが正確な製品名、説明、またはその両方で検索した場合でも、ハイブリッド検索を使用して関連する一致を表示できます。ElastiCache for Valkey は、AWS で人気のあるベクトルデータベースの中で、最も低レイテンシーのベクトル検索を提供し、最高のスループットと最良の料金パフォーマンスに加えて、95% 以上の再現率を実現します。
ハイブリッド検索は、すべての商用 AWS リージョン、AWS GovCloud (米国) リージョン、および中国リージョンにおいて、ElastiCache for Valkey バージョン 9.0 を実行するノードベースのクラスターで追加料金なしで利用できます。Valkey は、Redis に代わる最も許容的なオープンソースかつベンダーに依存しない選択肢であり、ElastiCache で推奨されるエンジンです。使用を開始するには、Valkey 9.0 以上の新しいクラスターを作成するか、AWS マネジメントコンソール、AWS SDK、または AWS CLI を使用して既存のクラスターをアップグレードします。詳細については、こちらのブログおよび ElastiCache のドキュメントをご覧ください。