Lernen
Osmo digitalisiert Gerüche und senkt die KI-Kosten um das 200-Fache mit Meta Llama in AWS

Osmo digitalisiert Gerüche und senkt die KI-Kosten um das 200-Fache mit Meta Llama in AWS

Wie war dieser Inhalt?

Im Rahmen seiner Bemühungen um die Digitalisierung von Düften Osmo entwickelt das Unternehmen KI-gestützte Tools, die aus kreativen kurzen Vorlagen Duftformeln generieren. Die Modellentwicklung stellt eine besonders komplexe Herausforderung dar, da die Ergebnisse nur durch die physische Herstellung des Duftes bewertet werden können. Das Team stützte sich zunächst auf proprietäre APIs für Frontier-Modelle, doch dies erwies sich aufgrund begrenzter Anpassungsmöglichkeiten, fehlender Kontrolle über die Modelle und hoher Kosten als nicht tragbar. Durch den Wechsel zu Meta Llama in Amazon Web Services(AWS) erlangte Osmo die volle Kontrolle über seine Modelle und Infrastruktur und senkte die Trainingskosten um das 20-Fache sowie die Inferenzkosten um das 200-Fache. In Bewertungen durch ausgebildete Parfümeure erreichte das offene Modellsystem die Leistung führender Spitzenmodelle.

Die Digitalisierung des letzten Sinnes der menschlichen Wahrnehmung

Computer haben gelernt zu sehen. Sie haben gelernt zu hören. Sie können Licht, Bewegung und Geräusche in Größenordnungen und Geschwindigkeiten erfassen, die die menschlichen Fähigkeiten bei weitem übersteigen. Doch während des größten Teils der Geschichte der Informatik blieb ein Sinn unerreichbar: der Geruchssinn. Osmo hat es sich zur Aufgabe gemacht, dies zu ändern. Das Unternehmen kombiniert Machine Learning, Parfümerie, Chemie und Neurowissenschaften, um das zu entwickeln, was es als „Olfactory Intelligence“ bezeichnet, und verleiht KI-Systemen so die Fähigkeit, die chemische Welt wahrzunehmen und zu interpretieren.

Heute bedient Osmo in erster Linie die Parfümindustrie, erweitert aber gleichzeitig aktiv die Möglichkeiten, wie Duft als Medium für das Brand Storytelling genutzt werden kann. Über die Studio-Plattform beginnen Benutzer mit einem Satz, einem Moodboard oder einem Image und legen dann Integritätsschutz wie zu vermeidende Duftnoten, Budget und Reinheitsstandards fest. Studio übersetzt diese Eingaben in fertigungsreife Formeln, die als physische Proben direkt an die Haustür der Kunden geliefert werden. Indem Osmo die Hürden für die Duftkreation senkt, verwandelt das Unternehmen Düfte von einem exklusiven Luxus in ein zugängliches, wirkungsvolles Tool für den modernen Markenauftritt.

Die Entwicklung dieser Technologie stellt ein einzigartig schwieriges Problem im Bereich des Machine Learning dar. Geruch ist außerordentlich hochdimensional. Die menschliche Nase verfügt über etwa 400 verschiedene Rezeptortypen, verglichen mit nur drei für das Sehen, und die Geruchswahrnehmung hängt von komplexen molekularen Kombinationen ab. Menschliche Beschreibungen von Düften sind bekanntermaßen inkonsistent, was die Erfassung von Daten mit Bezeichnung erschwert. „Im Gegensatz zu den meisten KI-Systemen können wir Ergebnisse nicht sofort bewerten. Wir müssen den Duft physisch herstellen und von Experten riechen lassen“, sagt Richard Whitcomb, CTO von Osmo. Jeder Bewertungszyklus dauert etwa zwei Wochen. Geschulte Bewerter bewerten die Proben dahingehend, wie gut sie dem Eingabebrief entsprechen, sowie hinsichtlich qualitativer Merkmale wie Ausgewogenheit, Tragbarkeit und Gesamtqualität als edler Duft. Dadurch entsteht eine eng gekoppelte Rückkopplungsschleife zwischen Modellausgabe und realer Bewertung. Da jede Schleife eine physische Produktion erfordert, ist die Iteration langsam und kostspielig, was die Kosten und die Flexibilität der zugrunde liegenden KI-Infrastruktur von entscheidender Bedeutung macht.

Osmo ging das Problem zunächst mit großen Frontier-Modell-APIs an, doch die Einschränkungen proprietärer Plattformen wurden mit wachsenden Ambitionen immer schwerer zu ignorieren. Die Trainingsmethoden waren auf das beschränkt, was die Plattform zuließ, und in einer so spezialisierten Domain war die Möglichkeit, das Modellverhalten tiefgreifend anzupassen, keine Option. Ebenso wenig wie die Eigenverantwortung: In einem Bereich, in dem optimierte Gewichte und geschützte Daten den Wettbewerbsvorteil ausmachen, wurde es für Osmo zunehmend unangenehm, auf Modellen aufzubauen, die es nicht selbst kontrollierte.

Der Übergang von geschlossenen Modellen zur Full-Stack-KI-Eigenverantwortung

Meta-Llama-Modelle in AWS gaben Osmo die Kontrolle und Flexibilität, die das Unternehmen benötigte, um sein System auf die richtige Weise aufzubauen. „Wir betrachten die Parfümkreation wie das Schreiben – das Erstellen von Formeln Zutat für Zutat, ähnlich wie Sprachmodelle Text generieren“, sagt Wesley Qian, VP of Engineering and Research bei Osmo. „Man legt zuerst die Hauptkomponenten fest, füllt dann die Lücken aus, und das Modell lernt diese Muster anhand der Daten.“ Dank der offenen Gewichte von Llama konnte Osmo diesen strukturierten, sequenziellen Prozess besser unterstützen, indem es das Modellverhalten gestaltete, Trainingsansätze anpasste und die Kontrolle über seine Infrastruktur und Modelle behielt. Dazu gehörten die Implementierung von Techniken wie Direct Preference Optimization (DPO), die Erstellung von agentischen Schleifen für das iterative Duftdesign sowie die Erforschung von Ansätzen des verstärkenden Lernens wie Group Relative Policy Optimization (GRPO).

Um diesen Ansatz zu skalieren, baute Osmo eine flexible Trainings- und Bereitstellungspipeline in AWS auf. Amazon SageMaker unterstützt Osmos Trainings- und Feinabstimmungs-Workflows auf proprietären Datensätzen, während die Modellgewichte in Amazon Simple Storage Service (Amazon S3) gespeichert und zur Bereitstellung in Amazon Bedrock importiert. Amazon Bedrock bietet Auto Scaling für Inferenz-Endpunkte, was zu einer kosteneffizienten Bereitstellung sowohl für Experimentier- als auch für Produktions-Workloads führt. „Der Umstieg auf Llama in AWS hat unsere Sichtweise auf die Entwicklung von KI-Systemen verändert“, sagt Whitcomb. „Anstatt unser Produkt an ein Modell anzupassen, können wir nun das Modell an unser Produkt anpassen.“

Während des gesamten Prozesses arbeiteten die AWS-Teams eng mit Osmo zusammen und trafen sich wöchentlich, um Strategien zur Datenaufbereitung und Modellkonfigurationen zu bewerten. Sie stellten Referenzimplementierungen, Support bei der Fehlerbehebung sowie Trainings- und Inferenzskripte bereit, damit Osmo schnell vom Experimentierbetrieb zu einer stabilen Produktionspipeline übergehen konnte. Nach der Bewertung verschiedener Meta-Llama-Varianten identifizierten AWS und Osmo die Meta-Llama-Modelle 3.1 8B und 3.3 70B Instruct als die leistungsstärksten, wobei das 8B-Modell ebenfalls brauchbare Ergebnisse lieferte. Die Zusammenarbeit erstreckte sich auch darauf, wie Osmo seine Modelle im Laufe der Zeit verfeinert: Hochleistungsfähige Formeln werden über eine gefilterte Augmentationsschleife wieder in das Training eingespeist, wobei erfolgreiche Ergebnisse dem Datensatz hinzugefügt werden, sodass nur validierte Ergebnisse in zukünftige Modellgenerationen einfließen. „Was AWS uns ermöglicht hat, ist ein echter End-to-End-Workflow vom Training bis zur Bereitstellung, den wir vollständig verstehen und kontrollieren“, sagt Whitcomb.

Parität erreichen, Kosten senken und die Kontrolle übernehmen

Von geschulten Bewertern durchgeführte Evaluierungen belegten, dass das Meta-Llama-3.3-70B-Modell die gleiche Leistung erzielte wie das auf großen Frontier-APIs basierende Produktionsmodell von Osmo. Es gab keinen statistisch signifikanten Unterschied bei den Kernkennzahlen, einschließlich der Übereinstimmung mit Deskriptoren und qualitativen Duftattributen. „Wir wussten, dass wir auf dem richtigen Weg waren, als unsere Sensorik-Panels nicht zwischen den Ergebnissen von Meta Llama 3.3 70B und denen von viel größeren Frontier-Modellen unterscheiden konnten“, sagt Sam Barnett, Senior Machine Learning Engineer bei Osmo. Am bedeutendsten war, dass die Trainingskosten um etwa das 10- bis 20-Fache sanken und die Inferenzkosten je nach Modellgröße und Durchsatz um bis zu das 200-Fache zurückgingen. Dies war eine grundlegende Veränderung dessen, was wirtschaftlich möglich ist. Wie Whitcomb sagt: „Wir können mehr experimentieren, schneller iterieren und unseren Kunden letztendlich bessere Ergebnisse liefern, während wir gleichzeitig die Kontrolle über unsere Modelle und Daten behalten.“

Durch die Unabhängigkeit von proprietären KI-Anbietern beseitigte Osmo auch das Risiko erzwungener Auslaufphasen oder unerwarteter Verhaltensänderungen. „Es geht wirklich darum, von der Anmietung von Intelligenz zum eigenen Aufbau überzugehen“, sagt Whitcomb, „und einen digitalen Parfümeur zu schaffen, den wir vollständig kontrollieren und kontinuierlich verbessern können.“ Mit reduzierten Kosten und voller Kontrolle kann Osmo schneller iterieren, mehr Daten generieren und seine Kernmodelle verfeinern. „Wenn man das Modell und die Infrastruktur kontrolliert, kann man Ideen erkunden, die in einem stärker eingeschränkten System einfach nicht möglich sind“, sagt Qian. Dies beschleunigt die übergeordnete Mission, olfaktorische Intelligenz so zugänglich und leistungsfähig zu machen wie die Tools, die wir bereits für Sehen und Hören haben. „Sobald Maschinen Gerüche interpretieren können, eröffnen sich völlig neue Anwendungsmöglichkeiten“, sagt Whitcomb, „von der Erkennung verdorbener Lebensmittel oder Schimmel in einem Gebäude bis hin zur Erkennung von Krankheiten und der Identifizierung von Umweltgefahren.“

Erfahren Sie, wie Amazon SageMaker und Amazon Bedrock neue Möglichkeiten für die Erstellung, Anpassung und Bereitstellung generative KI Modelle mit voller Kontrolle.

Wie war dieser Inhalt?