Aprenda
A Osmo digitaliza odores e reduz os custos de IA em 200 vezes com o Meta Llama na AWS

A Osmo digitaliza odores e reduz os custos de IA em 200 vezes com o Meta Llama na AWS

Como estava esse conteúdo?

Como parte de sua jornada rumo à digitalização do aroma, a Osmo desenvolve ferramentas baseadas em IA que geram fórmulas de fragrâncias a partir de briefings criativos. O desenvolvimento de modelos representa um desafio de complexidade única, pois os resultados só podem ser avaliados através da produção física do aroma. Inicialmente, a equipe contava com APIs de modelos de fronteira proprietárias, mas isso se tornou insustentável devido à personalização limitada, à falta de propriedade dos modelos e aos altos custos. Ao migrar para o Meta Llama na Amazon Web Services (AWS), a Osmo ganhou controle total sobre seus modelos e infraestrutura, reduzindo os custos de treinamento em 20 vezes e os custos de inferência em 200 vezes. Em avaliações realizadas por perfumistas experientes, seu sistema de modelo aberto igualou a performance dos principais modelos de ponta.

Digitalizar o sentido final da percepção humana

Os computadores aprenderam a ver. Aprenderam a ouvir. São capazes de detectar luz, movimento e som em grande escala e velocidades que excedem em muito a capacidade humana. Mas, durante a maior parte da história da computação, um sentido permaneceu fora de alcance: o olfato. A Osmo tem a missão de mudar isso. A empresa combina machine learning, perfumaria, química e neurociência para construir o que chama de “Inteligência Olfativa”, dando aos sistemas de IA a capacidade de perceber e interpretar o mundo químico.

Atualmente, a Osmo atende principalmente ao setor de fragrâncias, ao mesmo tempo em que expande ativamente as formas como o aroma pode ser utilizado como meio para contar a história de uma marca. Por meio de sua plataforma Studio, os usuários partem de uma frase, um moodboard ou uma imagem e, em seguida, definem barreiras de proteção como notas a evitar, orçamento e padrões de limpeza. O Studio traduz essas informações em fórmulas prontas para produção, que são entregues na porta dos clientes na forma de amostras físicas. Ao reduzir as barreiras à criação de aromas, a Osmo está transformando a fragrância de um luxo exclusivo em uma ferramenta acessível e poderosa para a expressão das marcas modernas.

Desenvolver essa tecnologia é um problema de machine learning de dificuldade singular. O olfato é extraordinariamente multidimensional. O nariz humano possui cerca de 400 tipos distintos de receptores, em comparação com apenas três na visão, e a percepção de odores depende de combinações moleculares complexas. As descrições humanas de aromas são notoriamente inconsistentes, o que dificulta a coleta de dados rotulados. “Ao contrário da maioria dos sistemas de IA, não podemos avaliar os resultados instantaneamente. Temos que produzir fisicamente a fragrância e pedir que especialistas a cheirem”, diz Richard Whitcomb, diretor de tecnologia da Osmo. Cada ciclo de avaliação leva aproximadamente duas semanas. Avaliadores treinados analisam as amostras para determinar o quanto elas correspondem ao briefing de entrada, juntamente com atributos qualitativos como equilíbrio, durabilidade e qualidade geral como uma fragrância fina. Isso cria um ciclo de feedback fortemente interligado entre a saída do modelo e a avaliação no mundo real. Como cada ciclo é necessário para a produção física, a iteração é lenta e cara, tornando o custo e a flexibilidade da infraestrutura de IA subjacente extremamente importantes.

Inicialmente, a Osmo abordou o problema utilizando grandes APIs de modelos de ponta, mas as restrições das plataformas proprietárias tornaram-se difíceis de ignorar à medida que suas ambições cresciam. Os métodos de treinamento limitavam-se ao que a plataforma permitia e, em um domínio tão especializado, a capacidade de personalizar profundamente o comportamento do modelo não era opcional. O mesmo se aplicava à propriedade: em um campo onde pesos ajustados com precisão e dados de treinamento proprietários constituem a vantagem competitiva, basear-se em modelos que a Osmo não controlava era uma situação cada vez mais incômoda.

Passando de modelos fechados para o controle total da IA

Os modelos Meta Llama na AWS proporcionaram à Osmo o controle e a flexibilidade necessários para construir seu sistema da maneira correta. “Encaramos a criação de fragrâncias como a escrita — construindo fórmulas ingrediente por ingrediente, de forma semelhante à maneira como os modelos de linguagem geram texto”, afirma Wesley Qian, vice-presidente de engenharia e pesquisa da Osmo. “Primeiro, você define os componentes principais; depois, preenche as lacunas, e o modelo aprende esses padrões a partir dos dados.” Com os pesos abertos do Llama, a Osmo conseguiu dar melhor suporte a esse processo estruturado e sequencial, moldando o comportamento do modelo, personalizando abordagens de treinamento e mantendo o controle sobre sua infraestrutura e modelos. Isso incluiu a implementação de técnicas como a Otimização Direta de Preferências (DPO), a construção de loops agênticos para o design iterativo de fragrâncias e a exploração de abordagens de aprendizado por reforço, como a Otimização de Política Relativa em Grupo (GRPO).

Para dar suporte a essa abordagem em grande escala, a Osmo criou um pipeline flexível de treinamento e implantação na AWS. O Amazon SageMaker impulsiona os fluxos de trabalho de treinamento e ajuste fino da Osmo em conjuntos de dados proprietários, enquanto os pesos dos modelos são armazenados no Amazon Simple Storage Service (Amazon S3) e importados para o Amazon Bedrock para implantação. O Amazon Bedrock oferece autoescala para pontos de extremidade de inferência, resultando em um serviço econômico tanto para cargas de trabalho de experimentação quanto de produção. “A migração para o Llama na AWS mudou a forma como pensamos sobre a construção de sistemas de IA”, diz Whitcomb. “Em vez de adaptar nosso produto para se adequar a um modelo, agora podemos adaptar o modelo para se adequar ao nosso produto.”

Ao longo do processo, as equipes da AWS trabalharam em estreita colaboração com a Osmo, reunindo-se semanalmente para avaliar estratégias de preparação de dados e configurações de modelos. Elas forneceram implementações de referência, suporte à depuração e scripts de treinamento e inferência para que a Osmo pudesse passar rapidamente da fase experimental para um pipeline de produção estável. Após avaliar as variantes do Meta Llama, a AWS e a Osmo identificaram os modelos Meta Llama 3.1 8B e 3.3 70B Instruct como os de melhor performance, com o modelo 8B também produzindo resultados viáveis. A colaboração se estendeu à forma como a Osmo refina seus modelos ao longo do tempo: fórmulas de alto desempenho são realimentadas no treinamento por meio de um ciclo de aumento filtrado, adicionando resultados com êxito de volta ao conjunto de dados para que apenas resultados validados informem as futuras gerações de modelos. “O que a AWS nos proporcionou foi um verdadeiro fluxo de trabalho de ponta a ponta, do treinamento à implantação, que compreendemos e controlamos totalmente”, diz Whitcomb.

Alcançar a equidade, reduzir custos e assumir o controle

Avaliações realizadas por avaliadores qualificados comprovaram que o modelo Meta Llama 3.3 70B atingiu uma performance equivalente à do modelo de produção da Osmo, desenvolvido com base em grandes APIs de ponta. Não houve diferença estatisticamente significativa nas principais métricas, incluindo o ajuste aos descritores e aos atributos qualitativos das fragrâncias. “Sabíamos que estávamos no caminho certo quando nossos painéis sensoriais não conseguiram distinguir entre os resultados do Meta Llama 3.3 70B e os de modelos de ponta muito maiores”, diz Sam Barnett, engenheiro sênior de machine learning da Osmo. Mais significativamente, os custos de treinamento caíram aproximadamente de 10 a 20 vezes, e os custos de inferência caíram em até 200 vezes, dependendo do tamanho do modelo e do throughput. Foi uma mudança fundamental no que é economicamente possível. Como diz Whitcomb: “Podemos experimentar mais, iterar mais rapidamente e, em última análise, entregar melhores resultados aos nossos clientes, tudo isso enquanto mantemos a propriedade de nossos modelos e dados.”

Ao eliminar a dependência de fornecedores proprietários de IA, a Osmo também eliminou o risco de descontinuações forçadas ou mudanças inesperadas de comportamento. “Trata-se, na verdade, de passar de alugar inteligência para construí-la nós mesmos”, diz Whitcomb, “e criar um perfumista digital que controlamos totalmente e podemos aprimorar continuamente”. Com os custos reduzidos e o controle totalmente em mãos, a Osmo pode iterar mais rapidamente, gerar mais dados e refinar seus modelos principais. “Quando você controla o modelo e a infraestrutura, pode explorar ideias que simplesmente não são possíveis em um sistema mais restrito”, diz Qian. Isso acelera sua missão mais ampla de tornar a inteligência olfativa tão acessível e poderosa quanto as ferramentas que já temos para a visão e o som. “Quando as máquinas conseguirem interpretar odores, você terá acesso a aplicações totalmente novas”, diz Whitcomb, “desde sinalizar alimentos estragados ou detectar mofo em um prédio até identificar doenças e riscos ambientais”.

Saiba como o Amazon SageMaker e o Amazon Bedrock abrir novas possibilidades para a criação, personalização e implantação de modelos de IA generativa com controle total.

Como estava esse conteúdo?