Aprender
Osmo digitaliza el olfato y reduce 200 veces los costos de IA con Meta Llama en AWS

Osmo digitaliza el olfato y reduce 200 veces los costos de IA con Meta Llama en AWS

¿Qué le pareció este contenido?

Como parte de su traspaso a la digitalización de los aromas, Osmo crea herramientas basadas en IA que generan fórmulas de fragancias a partir de informes creativos. El desarrollo de modelos presenta un desafío único y complejo, ya que los resultados solo pueden evaluarse produciendo físicamente el aroma. Al principio, el equipo se basó en las API patentadas del modelo de frontera, pero esto se hizo insostenible debido a la personalización limitada, la falta de propiedad de los modelos y los altos costos. Al pasar aMeta Llama en Amazon Web Services (AWS), Osmo obtuvo el control total de sus modelos e infraestructura, lo que permitió reducir los costos de capacitación en 20 veces y los costos de inferencia en 200 veces. Según las evaluaciones realizadas por perfumistas expertos, su sistema de modelo abierto igualó el rendimiento de los principales modelos de frontera

Digitalización del sentido final de la percepción humana

Las computadoras han aprendido a ver y escuchar, a detectar la luz, el movimiento y el sonido a escalas y velocidades que superan la capacidad humana. Sin embargo, durante la mayor parte de la historia de la informática, un sentido ha permanecido fuera de alcance: el olfato. Osmo tiene la misión de cambiar aquello. La empresa combina machine learning, perfumería, química y neurociencia para crear lo que denomina “inteligencia olfativa”, que otorga a los sistemas de IA la capacidad de detectar e interpretar el mundo químico.

Hoy, Osmo se desempeña principalmente en la industria de las fragancias y, a la vez, amplía activamente la forma en que las fragancias pueden usarse como medio para contar historias de marca. Mediante su plataforma Studio, los usuarios comienzan con una frase, una tabla de ideas o una imagen y, a al final, fijan barreras de protección, como notas a evitar, presupuestar y normas limpias. Studio traduce esos insumos en fórmulas listas para la fabricación que se entregan a los clientes en forma de muestras físicas. Al reducir las barreras para la creación de aromas, Osmo transforma las fragancias de un lujo exclusivo en una herramienta poderosa y accesible para la expresión de una marca moderna.

El desarrollo de esta tecnología supone un problema de machine learning de una dificultad sin precedentes. El olfato tiene altas dimensiones. La nariz posee aproximadamente 400 tipos distintos de receptores (en comparación con solo tres de la visión) y la percepción del olor depende de complejas combinaciones moleculares. Las descripciones humanas de los aromas son claramente inconsistentes, lo que dificulta la recopilación de datos etiquetados. Richard Whitcomb, CEO de Osmo, señala: “No podemos evaluar los resultados al instante como la mayoría de los sistemas de IA. Debemos producir físicamente la fragancia y hacer que personas expertas la huelan”. En aproximadamente dos semanas, evaluadores capacitados analizan las muestras para confirmar que coincidan con el resumen presentado y valorar atributos cualitativos como el equilibrio, la facilidad de uso y la calidad general de una fragancia fina. Esto crea un ciclo de retroalimentación estrechamente vinculado entre el resultado del modelo y la evaluación. Como cada ciclo requiere producción física, la iteración es lenta y costosa, por lo que el costo y la flexibilidad de la infraestructura de IA subyacente son de vital importancia.

Al principio, Osmo abordó el problema utilizando grandes API del modelo de frontera, pero las limitaciones de las plataformas propietarias se hicieron difíciles de ignorar a medida que crecían sus ambiciones. Los métodos de entrenamiento se limitaban a lo que permitía la plataforma y, en un entorno tan especializado, personalizar en profundidad el comportamiento de los modelos no era una opción. Tampoco lo era la propiedad: en un campo donde los pesos ajustados y los datos de entrenamiento patentados representan una ventaja competitiva, depender de modelos que Osmo no controlaba resultaba cada vez más incómodo.

De los modelos cerrados al control total de la IA

Los modelos de Meta Llama en AWS le dieron a Osmo control y flexibilidad necesaria para crear su sistema de la manera correcta. “Para nosotros, la creación de fragancias es como en la escritura: creamos fórmulas ingrediente por ingrediente, de forma similar a como los modelos de lenguaje generan texto”, destaca Wesley Qian, vicepresidente de ingeniería e investigación de Osmo. “Primero se establecen los componentes principales, luego se rellenan los vacíos y el modelo aprende esos patrones mediante datos”. Con los pesos abiertos de Llama, Osmo pudo respaldar mejor ese proceso estructurado y secuencial al configurar el comportamiento de los modelos, al personalizar los enfoques de entrenamiento y al mantener el control sobre su infraestructura y sus modelos. Esto incluyó aplicar técnicas como la optimización de preferencias directas (DPO), la creación de bucles de agencia para el diseño iterativo de fragancias y la exploración de enfoques de aprendizaje por refuerzo, como la optimización de políticas relativas grupales (GRPO).

A fin de respaldar este enfoque a escala, Osmo creó una línea flexible de capacitación e implementación en AWS. Amazon SageMaker impulsa los flujos de trabajo de entrenamiento y refinamiento de Osmo a partir de conjuntos de datos patentados, en cambio, los pesos de los modelos se almacenan enAmazon Simple Storage Service (Amazon S3) y se importan a Amazon Bedrock para su implementación. Amazon Bedrock ofrece un escalado automático para los puntos de conexión de inferencia, lo que permite ofrecer un servicio rentable tanto en las cargas de trabajo de experimentación como en las de producción. Whitcomb reconoce: “Pasarnos a Llama en AWS cambió nuestra forma de pensar sobre la creación de sistemas de IA. En vez de adaptar nuestro producto para que se ajuste a un modelo, ahora podemos adaptar el modelo para que se ajuste a nuestro producto”.

En el proceso, los equipos de AWS trabajaron en estrecha colaboración con Osmo y se reunieron semanalmente para evaluar las estrategias de preparación de datos y las configuraciones de los modelos. Brindaron implementaciones de referencia, soporte para la depuración y scripts de entrenamiento e inferencia para que Osmo pasara rápidamente de la experimentación a un proceso de producción estable. Tras evaluar las variantes de Meta Llama, AWS y Osmo concluyeron que los modelos Instruct Meta Llama 3.1 8B y 3.3 70B ofrecían el mejor rendimiento, y que el modelo 8B también arrojaba resultados viables. La colaboración también abarcó la forma en que Osmo perfecciona sus modelos con el tiempo: las fórmulas de alto rendimiento se incorporan al entrenamiento mediante un ciclo de aumento filtrado, agregando resultados satisfactorios al conjunto de datos, de modo que solo los resultados validados sirvan de base a las generaciones futuras de modelos. Whitcomb indica: “AWS nos permitió implementar un flujo de trabajo integral, desde el entrenamiento hasta la implementación, que comprendemos y controlamos por completo”.

Paridad, reducción de costos y control total

Las evaluaciones de expertos mostraron que el modelo Meta Llama 3.3 70B igualó el rendimiento del modelo de producción de Osmo basado en grandes API de última generación. No hubo diferencias estadísticamente importantes entre los parámetros principales, como el ajuste a los descriptores y los atributos cualitativos de las fragancias. “Sabíamos que íbamos por el buen camino cuando nuestros paneles sensoriales no podían distinguir entre las salidas de Meta Llama 3.3 70B y las de modelos de frontera mucho más grandes”, aclara Sam Barnett, ingeniero sénior de machine learning de Osmo. Los costos de capacitación se redujeron aproximadamente entre 10 y 20 veces, y los costos de inferencia se redujeron hasta 200 veces, según el tamaño del modelo y el rendimiento. Fue un cambio fundamental en lo que es económicamente posible. Whitcomb confirma: “Ahora podemos experimentar más, realizar iteraciones más rápido y ofrecer mejores resultados a nuestros clientes, sin dejar de ser propietarios de nuestros modelos y datos”.

Osmo, aparte de eliminar la dependencia de los proveedores de IA propietarios, también eliminó el riesgo de que se produjeran desaprobaciones forzadas o cambios de comportamiento inesperados. “Se trata de pasar de alquilar inteligencia a crearla nosotros mismos”, apunta Whitcomb, “y de crear un perfumista digital que podamos controlar y mejorar continuamente”. Con costos reducidos y control total, Osmo puede realizar iteraciones con mayor rapidez, generar más datos y perfeccionar sus modelos principales. Qian declara: “Cuando se controla el modelo y la infraestructura, se pueden explorar ideas que no son posibles en un sistema más restringido”. Esto acelera su misión más amplia de hacer que la inteligencia olfativa sea tan accesible y poderosa como las herramientas que ya tenemos para la vista y el sonido. “En cuanto las máquinas puedan interpretar los aromas, se abrirán aplicaciones nuevas”, afirma Whitcomb, “como detectar alimentos en mal estado, moho en un edificio, enfermedades, e identificar los peligros ambientales”.

Descubra cómo Amazon SageMaker y Amazon Bedrock ofrecen nuevas posibilidades para crear, personalizar e implementar modelos de IA generativa con un control total.

¿Qué le pareció este contenido?