Pelajari
Osmo Melakukan Digitisasi Aroma dan Memangkas Biaya AI Sebesar 200x dengan Meta Llama di AWS

Osmo Melakukan Digitisasi Aroma dan Memangkas Biaya AI Sebesar 200x dengan Meta Llama di AWS

Bagaimana konten ini?

Sebagai bagian dari perjalanannya menuju digitisasi aroma, Osmo membangun alat yang ditenagai AI yang menghasilkan formula wewangian dari ringkasan kreatif. Pengembangan model menghadirkan tantangan yang sangat kompleks karena hasilnya hanya dapat dievaluasi dengan memproduksi aroma secara fisik. Tim awalnya mengandalkan API model terdepan kepemilikan, tetapi ini menjadi tidak berkelanjutan karena kustomisasi terbatas, kurangnya kepemilikan model, dan biaya tinggi. Dengan beralih ke Meta Llama di Amazon Web Services (AWS), Osmo mendapatkan kontrol penuh atas model serta infrastrukturnya, memangkas biaya pelatihan sebesar 20 kali lipat dan biaya inferensi sebesar 200 kali lipat. Dalam evaluasi oleh para ahli pembuat parfum terlatih, sistem model terbukanya menyamai performa model terdepan terkemuka.

Melakukan digitisasi indra terakhir dari persepsi manusia

Komputer telah belajar melihat. Mereka telah belajar untuk mendengar. Mereka dapat mendeteksi cahaya, gerakan, dan suara pada skala dan kecepatan yang jauh melebihi kemampuan manusia. Namun, sepanjang sejarah komputasi, satu indra tetap berada di luar jangkauan: penciuman. Osmo memiliki misi untuk mengubah hal tersebut. Perusahaan ini menggabungkan machine learning, pembuatan parfum, kimia, serta ilmu saraf untuk membangun apa yang disebutnya “Kecerdasan Penciuman,” memberikan sistem AI kemampuan untuk merasakan dan menafsirkan dunia kimia.

Saat ini, Osmo terutama melayani industri wewangian, sekaligus juga secara aktif memperluas bagaimana aroma dapat digunakan sebagai media untuk bercerita merek. Melalui platform Studio-nya, pengguna memulai dari sebuah kalimat, papan suasana, atau gambar, kemudian mengatur batasan pengaman seperti catatan untuk dihindari, anggaran, dan standar bersih. Studio menerjemahkan input tersebut ke dalam formula siap produksi yang dikirimkan ke depan pintu pelanggan sebagai sampel fisik. Dengan menurunkan hambatan penciptaan aroma, Osmo mentransformasi wewangian dari kemewahan eksklusif menjadi alat canggih yang mudah diakses untuk ekspresi merek modern.

Membangun teknologi ini merupakan masalah machine learning yang sangat sulit. Penciuman memiliki dimensi yang luar biasa tinggi. Hidung manusia memiliki sekitar 400 jenis reseptor yang berbeda, dibandingkan dengan hanya tiga untuk penglihatan, dan persepsi bau bergantung pada kombinasi molekuler yang kompleks. Deskripsi manusia tentang aroma sangat tidak konsisten, sehingga data berlabel sulit dikumpulkan. “Tidak seperti kebanyakan sistem AI, kami tidak dapat mengevaluasi hasilnya secara instan. Kami harus memproduksi wewangian secara fisik serta meminta para ahli menciumnya,” kata Richard Whitcomb, CTO di Osmo. Setiap siklus evaluasi memakan waktu sekitar dua minggu. Evaluator terlatih menilai sampel untuk seberapa baik sampel tersebut cocok dengan ringkasan input bersama dengan atribut kualitatif seperti keseimbangan, daya tahan pakai, dan kualitas keseluruhan sebagai wewangian yang berkualitas. Hal ini menciptakan putaran umpan balik yang digabungkan erat antara output model dan evaluasi dunia nyata. Karena setiap putaran membutuhkan produksi fisik, iterasi lambat serta mahal, membuat biaya dan fleksibilitas infrastruktur AI yang mendasarinya sangat penting.

Awalnya, Osmo mendekati masalah ini menggunakan API model terdepan yang besar, tetapi kendala platform kepemilikan menjadi sulit untuk diabaikan ketika ambisinya tumbuh. Metode pelatihan terbatas pada apa yang diizinkan platform, dan dalam domain khusus ini, kemampuan untuk menyesuaikan perilaku model secara mendalam bukanlah pilihan. Begitu juga dengan kepemilikan: di bidang dengan bobot yang disempurnakan dan data pelatihan kepemilikan merupakan keunggulan kompetitif, membangun model yang tidak dikontrol oleh Osmo menjadi makin tidak nyaman.

Beralih dari model tertutup ke kepemilikan AI tumpukan penuh (full-stack)

Model Meta Llama di AWS memberi Osmo kontrol dan fleksibilitas yang dibutuhkan untuk membangun sistemnya dengan cara yang tepat. “Kami berpikir tentangpembuatan wewangian seperti menulis—membangun formula bahan demi bahan, mirip dengan bagaimana model bahasa menghasilkan teks,” kata Wesley Qian, VP of engineering and research di Osmo. “Anda meletakkan komponen utama terlebih dahulu, lalu mengisi kekosongan, dan model mempelajari pola-pola itu di seluruh data.” Dengan bobot terbuka dari Llama, Osmo mampu mendukung proses berurutan yang terstruktur secara lebih baik dengan membentuk perilaku model, menyesuaikan pendekatan pelatihan, serta mempertahankan kontrol atas infrastruktur dan modelnya. Itu termasuk mengimplementasikan teknik seperti Optimisasi Preferensi Langsung (DPO), membangun putaran agentik untuk desain wewangian iteratif, dan mengeksplorasi pendekatan pembelajaran penguatan seperti Optimisasi Kebijakan Relatif Grup (GRPO).

Untuk mendukung pendekatan ini dalam skala besar, Osmo membangun jalur pelatihan dan deployment yang fleksibel di AWS. Amazon SageMaker mendukung pelatihan Osmo dan alur kerja penyempurnaan pada set data kepemilikan, sementara bobot model disimpan di Amazon Simple Storage Service (Amazon S3) serta di impor ke Amazon Bedrock untuk deployment. Amazon Bedrock menyediakan penskalaan otomatis untuk titik akhir inferensi, yang mengarah ke penyajian hemat biaya di seluruh beban kerja eksperimen dan produksi. “Beralih ke Llama di AWS mengubah cara kami berpikir tentang membangun sistem AI,” kata Whitcomb. “Alih-alih mengadaptasi produk kami agar sesuai dengan model, kami sekarang dapat mengadaptasikan model agar sesuai dengan produk kami."

Sepanjang proses, tim AWS bekerja sama dengan Osmo, bertemu setiap minggu untuk mengevaluasi strategi persiapan data dan konfigurasi model. Mereka menyediakan implementasi referensi, dukungan debugging, dan skrip pelatihan serta inferensi agar Osmo dapat bergerak cepat dari eksperimen ke jalur produksi yang stabil. Setelah mengevaluasi varian Meta Llama, AWS dan Osmo mengidentifikasi model Meta Llama 3.1 8B dan 3.3 70B Instruct sebagai model terkuat, dengan model 8B juga menghasilkan output yang layak. Kolaborasi diperluas ke bagaimana Osmo menyempurnakan modelnya dari waktu ke waktu: formula beperforma tinggi diumpankan kembali ke pelatihan melalui putaran augmentasi yang difilter, menambahkan output yang berhasil kembali ke set data agar hanya hasil yang divalidasi yang menginformasikan pembuatan model masa depan. “Apa yang AWS berikan kepada kami adalah alur kerja end-to-end yang sesungguhnya mulai dari pelatihan hingga deployment yang kami pahami serta kontrol sepenuhnya,” kata Whitcomb.

Mencapai paritas, memangkas biaya, dan mengambil kontrol

Evaluasi yang dilakukan oleh evaluator terlatih membuktikan bahwa model Meta Llama 3.3 70B mencapai paritas performa dengan model produksi Osmo yang dibangun di API terdepan yang besar. Tidak ada perbedaan yang signifikan secara statistik di seluruh metrik inti, termasuk kecocokan dengan deskriptor dan atribut wewangian kualitatif. “Kami tahu kami berada di jalur yang benar ketika panel sensorik kami tidak dapat membedakan antara output Meta Llama 3.3 70B dan yang berasal dari model terdepan yang jauh lebih besar,” kata Sam Barnett, senior machine learning engineer di Osmo. Hal yang paling signifikan, biaya pelatihan turun sekitar 10–20 kali lipat, serta biaya inferensi turun hingga 200 kali lipat bergantung pada ukuran model dan throughput. Hal ini merupakan pergeseran mendasar dalam hal yang secara ekonomis mungkin dilakukan. Seperti yang dikatakan Whitcomb, “Kami dapat bereksperimen lebih banyak, melakukan iterasi lebih cepat, dan pada akhirnya memberikan hasil yang lebih baik kepada pelanggan kami, sambil mempertahankan kepemilikan model serta data kami."

Dengan menghilangkan dependensi pada penyedia AI kepemilikan, Osmo juga menghilangkan risiko penghentian paksa atau perubahan perilaku yang tidak terduga. “Ini benar-benar tentang beralih dari menyewa kecerdasan ke membangunnya sendiri,” kata Whitcomb, “dan menciptakan ahli pembuat parfum digital yang sepenuhnya kami kontrol dan dapat terus ditingkatkan. “Dengan biaya yang dikurangi serta kontrol sepenuhnya berada di tangan, Osmo dapat melakukan iterasi lebih cepat, menghasilkan lebih banyak data, dan memperbaiki model intinya. “Ketika Anda mengontrol model dan infrastruktur, Anda dapat mengeksplorasi ide-ide yang tidak mungkin dilakukan dalam sistem yang lebih terbatas,” kata Qian. Ini mempercepat misinya yang lebih luas untuk menjadikan kecerdasan penciuman dapat diakses serta secanggih alat yang sudah kami miliki untuk penglihatan dan suara. “Setelah mesin dapat menafsirkan aroma, Anda membuka aplikasi yang sama sekali baru,” kata Whitcomb, “mulai dari menandai makanan busuk atau merasakan jamur di gedung hingga mendeteksi penyakit dan mengidentifikasi bahaya lingkungan."

Pelajari cara Amazon SageMaker dan Amazon Bedrock membuka kemungkinan baru untuk membangun, menyesuaikan, dan melakukan deployment model AI generatif dengan kontrol penuh.

Bagaimana konten ini?