Apprendre
Osmo numérise l’odorat et réduit les coûts de l’IA d’un facteur 200 avec Meta Llama sur AWS

Osmo numérise l’odorat et réduit les coûts de l’IA d’un facteur 200 avec Meta Llama sur AWS

Comment a été ce contenu ?

Dans son parcours vers la numérisation de l’odorat, Osmo développe des outils optimisés par l’IA qui génèrent des formules de parfum à partir de briefs créatifs. Le développement de modèles représente un défi particulièrement complexe, car les résultats ne peuvent être évalués qu’en produisant physiquement la senteur. L’équipe s’est d’abord appuyée sur des API de modèles frontières exclusives, mais cette approche est devenue intenable en raison de la personnalisation limitée, de l’absence de propriété des modèles et des coûts élevés. En passant à Meta Llama sur Amazon Web Services (AWS), Osmo a pris le contrôle total de ses modèles et de son infrastructure, réduisant les coûts d’entraînement d’un facteur 20 et les coûts d’inférence d’un facteur 200. Lors d’évaluations menées par des parfumeurs formés, son système à modèle ouvert a égalé les performances des principaux modèles frontières.

Numérisation du dernier sens de la perception humaine

Les ordinateurs ont appris à voir. Ils ont appris à entendre. Ils détectent la lumière, le mouvement et le son à des échelles et à des vitesses qui dépassent largement les capacités humaines. Mais pendant la majeure partie de l’histoire de l’informatique, un sens est resté hors de portée : l’odorat. Osmo a pour mission de changer cela. L’entreprise associe machine learning, parfumerie, chimie et neurosciences pour construire ce qu’elle appelle l’« intelligence olfactive », qui donne aux systèmes d’IA la capacité de percevoir et d’interpréter le monde chimique.

Aujourd’hui, Osmo sert principalement l’industrie de la parfumerie, tout en développant activement les façons dont la senteur peut servir de support au récit de marque. Avec sa plateforme Studio, les utilisateurs partent d’une phrase, d’une planche d’inspiration ou d’une image, puis définissent des barrières de protection, comme les notes à éviter, un budget et des normes claires. Studio transforme ces entrées en formules prêtes pour la fabrication, livrées aux clients sous forme d’échantillons physiques. En abaissant les barrières à la création de senteurs, Osmo transforme le parfum, autrefois luxe exclusif, en un outil accessible et puissant d’expression de marque moderne.

La création de cette technologie constitue un problème de machine learning particulièrement difficile. L’odorat est extraordinairement multidimensionnel. Le nez humain compte environ 400 types de récepteurs distincts, contre seulement trois pour la vision, et la perception des odeurs dépend de combinaisons moléculaires complexes. Les descriptions humaines des odeurs sont notoirement incohérentes, ce qui rend la collecte de données étiquetées difficile. « Contrairement à la plupart des systèmes d’IA, nous ne pouvons pas évaluer les résultats instantanément. Nous devons produire physiquement le parfum et le faire sentir par des experts », explique Richard Whitcomb, directeur technique d’Osmo. Chaque cycle d’évaluation dure environ deux semaines. Des évaluateurs formés jugent les échantillons en fonction de leur adéquation au brief d’entrée, ainsi que d’attributs qualitatifs comme l’équilibre, la facilité à porter et la qualité globale en tant que parfum de parfumerie fine. Cela crée une boucle de rétroaction étroitement couplée entre la sortie du modèle et l’évaluation en conditions réelles. Chaque boucle nécessitant une production physique, l’itération est lente et coûteuse, ce qui rend le coût et la flexibilité de l’infrastructure d’IA sous-jacente d’une importance critique.

Osmo a d’abord abordé le problème en utilisant de grandes API de modèles frontières, mais les contraintes des plateformes exclusives sont devenues difficiles à ignorer à mesure que ses ambitions grandissaient. Les méthodes d’entraînement étaient limitées à ce que permettait la plateforme et, dans un domaine aussi spécialisé, la capacité à personnaliser en profondeur le comportement du modèle n’était pas facultative. La propriété ne l’était pas non plus : dans un domaine où les pondérations optimisées et les données d’entraînement exclusives constituent l’avantage concurrentiel, s’appuyer sur des modèles qu’Osmo ne contrôlait pas devenait de plus en plus inconfortable.

Passage de modèles fermés à la maîtrise de l’IA à pile complète

Les modèles Meta Llama sur AWS ont donné à Osmo le contrôle et la flexibilité dont l’entreprise avait besoin pour construire son système de la bonne manière. « Nous voyons la création de parfums comme l’écriture : on élabore des formules ingrédient par ingrédient, un peu comme les modèles de langage génèrent du texte », explique Wesley Qian, vice-président de l’ingénierie et de la recherche chez Osmo. « On pose d’abord les principaux composants, puis on comble les manques, et le modèle apprend ces schémas à partir des données. » Avec les pondérations ouvertes de Llama, Osmo a pu mieux accompagner ce processus structuré et séquentiel en façonnant le comportement du modèle, en personnalisant les approches d’entraînement et en gardant le contrôle de son infrastructure et de ses modèles. Cela comprenait la mise en œuvre de techniques comme l’optimisation directe des préférences (DPO), la création de boucles agentiques pour la conception itérative de parfums et l’exploration d’approches d’apprentissage par renforcement Group Relative Policy Optimization (GRPO).

Pour prendre en charge cette approche à l’échelle, Osmo a créé un pipeline flexible d’entraînement et de déploiement sur AWS. Amazon SageMaker alimente les flux de travail d’entraînement et de peaufinage d’Osmo sur des jeux de données exclusifs, tandis que les pondérations des modèles sont stockées dans Amazon Simple Storage Service (Amazon S3) et importées dans Amazon Bedrock pour le déploiement. Amazon Bedrock fournit la mise à l’échelle automatique des points de terminaison d’inférence, ce qui permet un service d’inférence rentable pour les charges de travail d’expérimentation comme de production. « Le passage à Llama sur AWS a changé notre façon de concevoir des systèmes d’IA », explique Richard Whitcomb. « Au lieu d’adapter notre produit à un modèle, nous pouvons désormais adapter le modèle à notre produit. »

Tout au long du processus, les équipes AWS ont travaillé en étroite collaboration avec Osmo, en se réunissant chaque semaine pour évaluer les stratégies de préparation des données et les configurations de modèle. Elles ont fourni des implémentations de référence, une assistance au débogage et des scripts d’entraînement et d’inférence afin qu’Osmo puisse passer rapidement de l’expérimentation à un pipeline de production stable. Après avoir évalué plusieurs variantes de Meta Llama, AWS et Osmo ont identifié les modèles Meta Llama 3.1 8B et 3.3 70B Instruct comme les plus performants, le modèle 8B produisant lui aussi des sorties viables. La collaboration s’est aussi étendue à la façon dont Osmo optimise ses modèles au fil du temps : les formules très performantes sont réinjectées dans l’entraînement au moyen d’une boucle d’augmentation filtrée, qui ajoute les sorties réussies au jeu de données afin que seuls des résultats validés alimentent les futures générations de modèles. « Ce qu’AWS nous a permis de mettre en place, c’est un véritable flux de travail de bout en bout, de l’entraînement au déploiement, que nous comprenons et contrôlons entièrement », explique Richard Whitcomb.

Atteinte de la parité, réduction des coûts et prise de contrôle

Les évaluations menées par des évaluateurs formés ont montré que le modèle Meta Llama 3.3 70B atteignait la parité de performances avec le modèle de production d’Osmo, bâti sur de grandes API de modèles frontières. Aucune différence statistiquement significative n’a été observée sur les métriques clés, notamment l’adéquation aux descripteurs et les attributs qualitatifs du parfum. « Nous avons su que nous étions sur la bonne voie lorsque nos panels sensoriels ne pouvaient pas distinguer les sorties de Meta Llama 3.3 70B de celles de modèles frontières beaucoup plus grands », explique Sam Barnett, ingénieur principal en machine learning chez Osmo. Surtout, les coûts d’entraînement ont été divisés par environ 10 à 20, et les coûts d’inférence ont chuté d’un facteur pouvant atteindre 200 selon la taille du modèle et le débit. Cela a constitué un changement fondamental de ce qui est économiquement possible. Comme l’explique Richard Whitcomb : « Nous pouvons expérimenter davantage, itérer plus vite et, au bout du compte, fournir de meilleurs résultats à nos clients, tout en conservant la propriété de nos modèles et de nos données. »

En éliminant sa dépendance aux fournisseurs d’IA exclusives, Osmo a également éliminé le risque de dépréciations imposées ou de changements de comportement inattendus. « Il s’agit vraiment de passer de la location d’intelligence à sa construction en interne », explique Richard Whitcomb, « et de créer un parfumeur numérique que nous contrôlons pleinement et que nous pouvons améliorer en continu. » Avec des coûts réduits et un contrôle total, Osmo peut itérer plus vite, générer davantage de données et optimiser ses modèles de base. « Quand vous contrôlez le modèle et l’infrastructure, vous pouvez explorer des idées tout simplement impossibles dans un système plus contraint », explique Wesley Qian. Cela accélère sa mission plus large : rendre l’intelligence olfactive aussi accessible et puissante que les outils dont nous disposons déjà pour la vue et l’ouïe. « Dès que les machines savent interpréter les odeurs, vous ouvrez la voie à des applications entièrement nouvelles », explique Richard Whitcomb, « qu’il s’agisse de signaler des aliments avariés, de repérer des moisissures dans un bâtiment, de détecter des maladies ou d’identifier des dangers environnementaux. »

Découvrez comment Amazon SageMaker et Amazon Bedrock ouvrent de nouvelles possibilités pour créer, personnaliser et déployer des modèles d’IA générative avec un contrôle total.

Comment a été ce contenu ?