Làm thế nào để chuyển đổi văn bản thành giọng nói trong Python?

Chuyển đổi văn bản thành giọng nói về cơ bản đề cập đến một chương trình trong đó bạn cung cấp đầu vào dưới dạng văn bản và đầu ra bạn nhận được là văn bản đầu vào dưới dạng lời nói.

Python cung cấp chuyển đổi văn bản thành giọng nói với sự trợ giúp của các API. Một API như vậy phục vụ mục đích này là API chuyển văn bản thành giọng nói của Google, được gọi là gTTS. GTTS cho phép chuyển đổi văn bản được cung cấp thành giọng nói và lưu đầu ra dưới dạng âm thanh.

Bước 1 - Cài đặt gTTS

Để sử dụng công cụ chuyển đổi văn bản thành giọng nói của gTTS, trước tiên chúng ta cần cài đặt nó. Cài đặt gTTS khá dễ dàng.

Mở thiết bị đầu cuối và nhập thông tin sau -

pip install gTTS

Lệnh trên sẽ cài đặt gTTS.

Bước 2 - Viết chương trình để chuyển văn bản thành giọng nói

Nhập gTTS.
Chỉ định văn bản bạn muốn chuyển đổi.
Gọi gTTS (). Điều này có ba tham số -
- text:Văn bản đầu vào mà bạn muốn chuyển thành giọng nói.
- ngôn ngữ:Độ trễ mà bạn muốn chuyển đổi bài phát biểu. GTTS hỗ trợ nhiều ngôn ngữ bao gồm tiếng Anh, tiếng Hindi, tiếng Pháp, tiếng Đức, v.v.
- chậm hay nhanh:Tùy chọn này chỉ định tốc độ âm thanh. Hai tốc độ âm thanh có sẵn, nhanh hoặc chậm. Tham số slow nhận giá trị boolean chỉ định tốc độ âm thanh mong muốn trong số hai tùy chọn khả dụng.
Đầu ra sẽ được trả về biến khi gọi gTTS (). Đầu ra có thể được lưu dưới dạng tệp mp3.
Nếu bạn muốn phát âm thanh đầu ra, chúng tôi có thể làm điều đó bằng cách sử dụng os.system (). Chúng ta cần nhập hệ điều hành cho mục đích này. Chuyển tên của âm thanh đã lưu vào os.system () để phát âm thanh.

Ví dụ

from gtts import gTTS
myText="I want to learn Python"
speech=gTTS(text=myText,lang="en",slow=False)
speech.save("tts.mp3")