학습
Osmo, AWS에서 Meta Llama를 통해 후각을 디지털화하고 AI 비용을 200배 절감

Osmo, AWS에서 Meta Llama를 통해 후각을 디지털화하고 AI 비용을 200배 절감

이 콘텐츠는 어떠셨나요?

향을 디지털화하기 위한 여정의 일환으로 Osmo는 창작 지침서에서 향수 포뮬러를 생성하는 AI 기반 도구를 구축하고 있습니다. 실제로 향을 제작해봐야만 결과를 평가할 수 있기 때문에 모델 개발은 매우 복잡한 과제를 안고 있습니다. 팀은 처음에 독점적인 프론티어 모델 API에 의존했지만, 제한적인 사용자 지정 기능, 모델 소유권 부재, 높은 비용 때문에 이 방식은 지속 가능하지 않았습니다. Amazon Web Services(AWS)의 Meta Llama로 전환하면서 Osmo는 모델과 인프라를 완전히 제어하여 학습 비용을 20배, 추론 비용을 200배 절감했습니다. 숙련된 조향사의 평가에서 오픈 모델 시스템은 선도적인 프론티어 모델에 필적하는 성능을 보였습니다.

인간 지각의 마지막 감각을 디지털화

컴퓨터는 보는 법을 배웠습니다. 듣는 법도 배웠습니다. 인간의 능력을 훨씬 뛰어넘는 규모와 속도로 빛, 움직임, 소리를 감지할 수 있습니다. 그러나 컴퓨팅 역사의 대부분을 통틀어 아직 접근하지 못한 감각이 하나 있었습니다. 바로 후각입니다. Osmo는 이를 바꿔야겠다는 사명을 가지고 있습니다. 이 회사는 기계 학습, 조향, 화학, 신경과학을 결합하여 ‘후각 지능(Olfactory Intelligence)’이라는 기술을 구축하여 AI 시스템이 화학적 세계를 감지하고 해석할 수 있도록 하고 있습니다.

현재 Osmo는 주로 향수 산업에 서비스를 제공하는 한편, 향을 브랜드 스토리텔링의 매개체로 활용하는 방식을 적극적으로 확장하고 있습니다. Studio 플랫폼에서는 사용자가 문장, 무드보드 또는 이미지에서 출발한 뒤 피해야 할 향 노트, 예산, 클린 기준과 같은 가드레일을 설정합니다. Studio는 이러한 입력 내용을 제조 가능한 포뮬러로 변환하고, 실제 샘플을 고객의 문앞까지 배송합니다. Osmo는 향 제작의 장벽을 낮추어 향수를 일부만 누릴 수 있는 고급 사치품에서 현대 브랜드 표현을 위한 접근 가능하고 강력한 도구로 변화시키고 있습니다.

이 기술을 구축하는 것은 기계 학습 측면에서 매우 까다로운 문제입니다. 후각은 차원이 극도로 높은 감각입니다. 인간의 코에는 약 400개의 서로 다른 수용체 유형이 있는데, 시각은 단 3개에 불과하며 냄새 인지는 복잡한 분자 조합에 따라 결정됩니다. 사람이 향을 설명하는 방식은 일관성이 매우 낮기 때문에 레이블이 지정된 데이터를 수집하기도 어렵습니다. Osmo의 CTO인 Richard Whitcomb은 “대부분의 AI 시스템과 달리 우리는 결과를 즉시 평가할 수 없다. 실제로 향을 만들어 전문가가 맡아봐야 합니다.”라고 말합니다. 각 평가 주기는 약 2주가 걸립니다. 숙련된 평가자는 샘플이 초기 요구 사항과 얼마나 잘 부합하는지, 그리고 균형감, 착향감, 고급 향수로서의 전반적 품질 같은 정성적 속성을 평가합니다. 이로 인해 모델 결과물과 실제 평가 간에 밀접하게 연결된 피드백 루프가 형성됩니다. 각 루프마다 실제 생산이 필요하므로 반복 작업은 느리고 비용이 많이 들며, 따라서 기반 AI 인프라의 비용 효율성과 유연성이 매우 중요합니다.

Osmo는 처음에 대규모 프론티어 모델 API를 사용해 이 문제에 접근했지만, 목표가 커질수록 독점 플랫폼의 제약을 무시하기 어려워졌습니다. 학습 방식은 플랫폼이 허용하는 범위로 제한되었고, 이처럼 고도로 특화된 영역에서는 모델 동작을 심층적으로 사용자 지정하는 기능이 선택 사항이 아니었습니다. 소유권 역시 마찬가지였습니다. 미세 조정된 가중치와 독점 학습 데이터가 경쟁 우위인 분야에서 Osmo가 통제할 수 없는 모델 위에 구축하는 것은 점점 더 불편한 선택이 되었습니다.

폐쇄형 모델에서 풀 스택 AI 소유로 전환

AWS의 Meta Llama 모델은 Osmo에 시스템을 올바르게 구축하는 데 필요한 제어력과 유연성을 제공했습니다. Osmo의 Engineering and Research VP인 Wesley Qian은 “우리는 향수 제작을 글쓰기처럼 생각합니다. 텍스트를 생성하는 언어 모델처럼, 성분을 하나씩 추가하며 포뮬러를 구축하는 방식입니다.”라면서 “먼저 주요 구성 요소를 배치한 다음 빈 부분을 채우고, 모델은 데이터 전반에서 이러한 패턴을 학습합니다.”라고 설명합니다. Llama의 오픈 가중치를 통해 Osmo는 모델 동작을 조정하고, 학습 접근 방식을 사용자 지정하며, 인프라와 모델에 대한 제어권을 유지함으로써 이러한 체계적이고 순차적인 프로세스를 더 효과적으로 지원할 수 있었습니다. 여기에는 직접 선호도 최적화(DPO) 같은 기법 구현, 반복적 향 설계를 위한 에이전트 루프 구축, 그룹 상대 정책 최적화(GRPO) 같은 강화 학습 접근 방식 탐색이 포함되었습니다.

이 접근 방식을 대규모로 지원하기 위해 Osmo는 AWS에서 유연한 학습 및 배포 파이프라인을 구축했습니다. Amazon SageMaker는 독점 데이터세트 기반의 학습 및 미세 조정 워크플로를 지원하고, 모델 가중치는 Amazon Simple Storage Service(Amazon S3)에 저장된 뒤 Amazon Bedrock으로 가져와 배포됩니다. Amazon Bedrock은 추론 엔드포인트에 대한 자동 확장을 제공하여 실험 및 프로덕션 워크로드 모두에서 비용 효율적인 서비스 운영이 가능합니다. Whitcomb은 “AWS에서 Llama로 전환하면서 AI 시스템 구축에 대한 우리의 사고방식이 바뀌었습니다.”라면서 “이제는 제품을 모델에 맞추는 대신, 모델을 제품에 맞출 수 있습니다.”라고 말합니다.

이 과정에서 AWS 팀은 Osmo와 긴밀히 협력하며 매주 회의를 통해 데이터 준비 전략과 모델 구성을 평가했습니다. 참조 구현, 디버깅 지원, 학습 및 추론 스크립트를 제공해 Osmo가 실험 단계에서 안정적인 프로덕션 파이프라인으로 빠르게 전환할 수 있도록 도왔습니다. Meta Llama 변형 모델을 평가한 끝에 AWS와 Osmo는 Meta Llama 3.1 8B와 3.3 70B Instruct 모델이 가장 우수한 성능을 보인다고 판단했으며, 8B 모델도 실용적인 출력을 산출했습니다. 협업은 시간이 지나면서 모델을 개선하는 방식으로도 확장되었습니다. 성능이 우수한 포뮬러는 필터링된 증강 루프를 통해 다시 학습에 반영되며, 성공적인 출력을 데이터세트에 다시 추가하여 검증된 결과만 향후 모델 생성에 활용합니다. Whitcomb은 “AWS를 통해 학습부터 배포까지 우리가 완전히 이해하고 제어할 수 있는 진정한 엔드 투 엔드 워크플로가 가능해졌습니다.”라고 말합니다.

동등한 성능 달성, 비용 절감, 제어권 확보

숙련된 평가자가 실시한 평가 결과, Meta Llama 3.3 70B 모델은 대규모 프론티어 API 기반으로 구축된 Osmo의 프로덕션 모델과 동등한 성능을 달성한 것으로 입증되었습니다. 설명자 적합성 및 향의 정성적 속성을 포함한 핵심 지표 전반에서 통계적으로 유의미한 차이는 없었습니다. Osmo의 Senior Machine Learning Engineer인 Sam Barnett는 “감각 평가 패널이 Meta Llama 3.3 70B의 출력과 훨씬 더 큰 프론티어 모델의 출력을 구분하지 못했을 때 우리가 올바른 방향으로 가고 있다는 것을 알았습니다.”라고 말합니다. 가장 중요한 점은 모델 크기와 처리량에 따라 학습 비용이 약 10~20배 감소했고, 추론 비용은 최대 200배까지 줄었다는 것입니다. 이는 경제성 측면에서 근본적인 변화였습니다. Whitcomb의 말처럼 “우리는 더 많이 실험하고, 더 빠르게 반복하며, 모델과 데이터에 대한 소유권을 유지하면서 궁극적으로 고객에게 더 나은 결과를 제공할 수 있게 되었습니다.”

독점 AI 제공업체에 대한 의존성을 제거함으로써 Osmo는 강제 지원 종료나 예기치 않은 동작 변경 위험도 없앴습니다. Whitcomb은 "이것은 본질적으로 지능을 임대하는 방식에서 직접 구축하는 방식으로 전환하고, 우리가 완전히 제어하고 지속적으로 개선할 수 있는 디지털 조향사를 만드는 일입니다."라고 말합니다. 비용을 절감하고 완전한 제어권을 확보한 Osmo는 더 빠르게 반복하고, 더 많은 데이터를 생성하며, 핵심 모델을 정교화할 수 있게 되었습니다. Qian은 “모델과 인프라를 제어하면 더 제약이 많은 시스템에서는 불가능한 아이디어를 탐색할 수 있습니다.”라고 말합니다. 이는 후각 지능을 시각과 청각 분야에서 이미 보유한 도구만큼 접근 가능하고 강력하게 만들려는 더 큰 사명을 가속화합니다. Whitcomb은 “기계가 향을 해석할 수 있게 되면 상한 음식 감지, 건물 내 곰팡이 탐지부터 질병 감지와 환경 위험 식별까지 완전히 새로운 응용 분야가 열립니다.”라고 말합니다.

Amazon SageMaker와 Amazon Bedrock이 어떻게 완전한 제어권을 바탕으로 생성형 AI 모델을 구축, 사용자 지정, 배포하는 새로운 가능성을 열어주는지 알아보세요.

이 콘텐츠는 어떠셨나요?