Amazon SageMaker JumpStart'ta konuşma tanıma ve metin okuma için üç yeni model kullanıma sunuldu

Yayınlanma Tarihi: 14 May 2026

AWS bugün Amazon SageMaker JumpStart'ta QWen3-TTS-12HZ-1.7B-CustomVoice, QWen3-TTS-12HZ-1.7B-Base ve Qwen3-ASR-1.7b'nin kullanılabilirliğini duyurarak AWS müşterilerinin kullanabileceği temel model portföyünü genişletti. Qwen'in bu üç modeli, müşterilerin AWS altyapısında akıllı ses destekli uygulamalar oluşturmasına olanak tanıyan 10'dan fazla dilde gelişmiş konuşma sentezi ve algılama özellikleri sunar.

Bu modeller, farklı kurumsal konuşma ve ses zorluklarını özel özelliklerle ele alır:

QWEN3-TTS-12HZ-1.7B-CustomVoice, özelleştirilebilir ses stilleriyle çok dilli metin okumada mükemmeldir ve tını, duygu ve anız üzerinde talimat odaklı kontrol ile 10 dili destekler. Gerçek zamanlı etkileşimli ses uygulamaları, müşteriye yönelik sanal asistanlar ve doğal ve etkileyici konuşma çıktısı gerektiren içerik oluşturma iş akışları için idealdir.

QWen3-TTS-12HZ-1.7B-Base, ses girdisinden 3 saniyelik hızlı ses klonlama ile çok dilli metin okumada mükemmeldir. Özel ses uygulamaları oluşturma, alana özgü konuşma sentezini ince ayarlama ve geliştiricilerin ses üretimi için esnek bir temel modeline ihtiyaç duyduğu senaryolar için idealdir.

52 dil ve lehçeyi destekleyen Qwen3-ASR-1.7B, karmaşık akustik ortamlarda otomatik konuşma tanımada mükemmeldir. Transkripsiyon hizmetleri, çok dilli müşteri desteği ve gerçek zamanlı alt yazı gibi sağlam akış ve çevrimdışı metin okuma gerektiren uygulamalar için idealdir.

Müşteriler, SageMaker JumpStart ile belirli yapay zeka kullanım ihtiyaçları için bu modellerden herhangi birini yalnızca birkaç tıklamayla devreye alabilirler.

Bu modelleri kullanmaya başlamak için SageMaker Stüdyosu'nun Modeller bölümüne gidin veya modelleri AWS hesabınıza dağıtmak için SageMaker Python SDK'sini kullanın. SageMaker JumpStart'ta temel model dağıtma ve kullanma hakkında daha fazla bilgi için Amazon SageMaker JumpStart belgelerine bakın.

Amazon SageMaker JumpStart'ta konuşma tanıma ve metin okuma için üç yeni model kullanıma sunuldu

Öğrenin

Kaynaklar

Geliştiriciler

Yardım