Ba mô hình mới để nhận diện giọng nói và chuyển văn bản thành giọng nói hiện có sẵn trong Amazon SageMaker JumpStart
Hôm nay, AWS đã công bố việc cung cấp Qwen3-TTS-12Hz-1.7B-CustomVoice, Qwen3-TTS-12Hz-1.7B-Base và Qwen3-ASR-1.7B trong Amazon SageMaker JumpStart, mở rộng danh mục mô hình nền tảng được cung cấp cho khách hàng AWS. Ba mô hình này từ Qwen mang đến khả năng tổng hợp và nhận diện giọng nói tiên tiến trên hơn 10 ngôn ngữ, cho phép khách hàng xây dựng ứng dụng hỗ trợ giọng nói thông minh trên cơ sở hạ tầng AWS.
Các mô hình này giải quyết những thách thức khác nhau về giọng nói và âm thanh của doanh nghiệp với các khả năng chuyên biệt:
Qwen3-TTS-12Hz-1.7B-CustomVoice vượt trội trong việc chuyển văn bản thành giọng nói đa ngôn ngữ với các kiểu giọng nói có thể tùy chỉnh, hỗ trợ 10 ngôn ngữ với khả năng kiểm soát âm sắc, cảm xúc và ngữ điệu theo hướng dẫn. Đây là lựa chọn lý tưởng để xây dựng ứng dụng thoại tương tác theo thời gian thực, trợ lý ảo tương tác với khách hàng và quy trình công việc tạo nội dung yêu cầu đầu ra giọng nói tự nhiên, biểu cảm.
Qwen3-TTS-12Hz-1.7B-Base vượt trội trong việc chuyển văn bản thành giọng nói đa ngôn ngữ với khả năng nhân bản giọng nói nhanh trong 3 giây từ đầu vào âm thanh. Đây là lựa chọn lý tưởng để xây dựng ứng dụng giọng nói tùy chỉnh, tinh chỉnh tổng hợp giọng nói đặc thù theo lĩnh vực và các tình huống mà nhà phát triển cần một mô hình nền tảng linh hoạt để tạo giọng nói.
Qwen3-ASR-1.7B vượt trội về nhận diện giọng nói tự động hỗ trợ 52 ngôn ngữ và phương ngữ với độ chính xác tiên tiến trong môi trường âm thanh phức tạp. Đây là lựa chọn lý tưởng cho các dịch vụ chép lời, hỗ trợ khách hàng đa ngôn ngữ, phụ đề thời gian thực và ứng dụng yêu cầu khả năng truyền phát mạnh mẽ và chuyển giọng nói thành văn bản ngoại tuyến.
Với SageMaker JumpStart, khách hàng có thể triển khai bất kỳ mô hình nào trong số này chỉ với một vài cú nhấp chuột để giải quyết các trường hợp sử dụng AI cụ thể của họ.
Để bắt đầu với các mô hình này, bạn hãy điều hướng đến phần Mô hình của Studio SageMaker hoặc sử dụng SageMaker Python SDK để triển khai mô hình vào tài khoản AWS của bạn. Để biết thêm thông tin về cách triển khai và sử dụng mô hình nền tảng trong SageMaker JumpStart, hãy xem tài liệu về Amazon SageMaker JumpStart.