似乎在 gTTS 上,除了缓慢的参数之外,没有其他选项可以更改文本到语音的语音。
我想将声音速度加快 5%。关于我该如何做有什么建议吗?
最好的。
tts_de = gTTS("Hallo, guten tag.", lang = 'de')
tts_de.save("s.mp3")
Run Code Online (Sandbox Code Playgroud) 我知道像 Google Text to Speech 这样的库。然而,这在 Colab 中却不起作用。我最近在 Colab https://colab.research.google.com/github/tugstugi/pytorch-dc-tts/blob/master/notebooks/EnglishTTS.ipynb#scrollTo=jLU2p4Gq_12d中遇到了一个复杂的笔记本,我们可以在其中转换文本到演讲。但是,是否有一种简单的方法可以使用 Google Text to Speech 或 Google Colab 中的其他库?
这样我就提供了一个 String-"My name is XYZ"并在 Colab 笔记本中读出它。(这发生在我提供的链接中,但相当复杂)。
PS 如果可能的话,我希望音频能够自动播放,就像 GTTS 那样。在此笔记本中,我们需要单击“播放”按钮来输出语音。
python text-to-speech google-cloud-platform google-colaboratory gtts
我正在制作一个使用 gTTS 和 Google Speech 的助手,但出现此错误。语音识别很好,因为它可以无误地识别。我用打印功能进行了测试,但是当我想要文本到语音时,这个错误就来了。...
import speech_recognition as sr
from time import ctime
import time
import playsound
import os
import random
from gtts import gTTS
import webbrowser
r = sr.Recognizer()
def record_audio(ask=False):
with sr.Microphone() as source:
if ask:
watson_speak(ask)
audio = r.listen(source)
voice_data = ''
try:
voice_data = r.recognize_google(audio)
except sr.UnknownValueError:
watson_speak("Sorry, I did not catch that")
except sr.RequestError:
watson_speak("I am offline right now")
return voice_data
def watson_speak(audio_string):
tts = gTTS(text=audio_string, lang='en')
r = random.randint(1, 10000000)
audio_file = 'audio-' …Run Code Online (Sandbox Code Playgroud) 我想在 pydub 中操作 gtts 音频,但我不确定如何将 gtts 文件转换为 pydub 音频。
我知道我可以将谷歌文本转换为语音音频到 mp3,并且我知道我可以使用 pydub 导入 mp3,但这个过程效率很低。有没有办法跳过创建 mp3 文件并将其读回?
我尝试使用 gtts file-like 作为参数,AudioSegment.from_mp3()但我很确定它正在寻找一个字符串。
from gtts import gTTS
from io import BytesIO
from pydub import AudioSegment
mp3_fp = BytesIO()
tts = gTTS('hello', 'en')
tts.write_to_fp(mp3_fp)
song = AudioSegment.from_mp3(mp3_fp)
Run Code Online (Sandbox Code Playgroud)
我收到“无法解码错误”:
File "C:\ProgramData\Anaconda3\lib\site-packages\spyder\utils\site\sitecustomize.py", line 102, in execfile
exec(compile(f.read(), filename, 'exec'), namespace)
File "C:/Users/py/ex/gtts_test.py", line 18, in <module>
song = AudioSegment.from_mp3(mp3_fp)
File "C:\ProgramData\Anaconda3\lib\site-packages\pydub\audio_segment.py", line 716, in from_mp3
return cls.from_file(file, 'mp3', parameters=parameters)
File "C:\ProgramData\Anaconda3\lib\site-packages\pydub\audio_segment.py", line 704, in …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用 gTTS 模块在 Python 中将文本转换为语音。有没有一种方法可以使用,不涉及将音频保存到 mp3 文件,而是直接播放它?我在网上查了一段时间,但仍然找不到完全避免保存到文件的方法。谢谢!
我想为使用 gTTS 的语音助手创建 python 代码。我运行了代码,但它没有像它显示的那样工作,
回溯(最近一次调用最后一次):
文件“/Users/niallquadros/Desktop/voiceassistant.py”,第 1 行,来自
<module>gTTS 导入 gTTSModuleNotFoundError:没有名为“gTTS”的模块
相反,它应该给我结果,并充当语音助手。
这是我在 MacBook Air 2019 上使用 python (3.7.4) 编写的代码
from gTTS import gTTS
import speech_recognition as sr
import os
import webbrowser
import satplib
def talkToMe(audio):
print (audio)
tts = gTTs(text=audio, lang='en')
tts.save('audio.mp3')
os.system('mpg123 audio.mp3')
#Listen for commands
def myCommand():
r = sr.Recognizer()
with sr.Microphone() as source:
print('I am ready for your next command')
r.pause_threshold = 1
r.adjust_for_ambient_noise(source, duration = 1)
audio = r.listen(source)
try:
command = …Run Code Online (Sandbox Code Playgroud) 我正在使用 gtts 作为文本到语音和语音识别来构建语音辅助。但是我在要保存机器人输入的行中遇到错误。
错误信息如下:
Traceback (most recent call last):
File "d:\rasa test\voice_bot.py", line 64, in <module>
myobj.save(filename)
File "D:\Anaconda\lib\site-packages\gtts\tts.py", line 295, in save
prepared_requests = self._prepare_requests()
File "D:\Anaconda\lib\site-packages\gtts\tts.py", line 194, in _prepare_requests
part_tk = self.token.calculate_token(part)
File "D:\Anaconda\lib\site-packages\gtts_token\gtts_token.py", line 28, in calculate_token
seed = self._get_token_key()
File "D:\Anaconda\lib\site-packages\gtts_token\gtts_token.py", line 58, in _get_token_key
raise ValueError(
ValueError: Unable to find token seed! Did https://translate.google.com change?
Run Code Online (Sandbox Code Playgroud)
这是gtts的问题还是其他问题,谁能解释一下?
python speech-recognition text-to-speech google-text-to-speech gtts