我尝试更换扬声器,但我没有在SpeechSynthesizer课堂上列出所有已安装的扬声器(乔治、苏珊、雅库布),另一方面,我有一个根本没有安装的扬声器(齐拉)。
这里发生了什么事?我可以以某种方式将特定的扬声器添加到我的项目中(例如作为 .dll 或其他内容)以不依赖于计算机语言/区域吗?
用于扩展( https://developer.chrome.com/extensions/tts)和SpeechSynthesis(https://developer.mozilla.org/en-US/docs/Web/API/SpeechSynthesis )API的chrome.tts似乎是能够做同样的事情。除了可用功能上的一些差异之外,我确实没有看到任何差异,但它们仍然可以做同样的事情。有什么我应该注意的差异吗?
编辑:我需要专门用于 chrome 扩展程序,我知道 chrome.tts 仅适用于 chrome 扩展程序/应用程序。
javascript google-chrome text-to-speech google-chrome-extension
我知道像 Google Text to Speech 这样的库。然而,这在 Colab 中却不起作用。我最近在 Colab https://colab.research.google.com/github/tugstugi/pytorch-dc-tts/blob/master/notebooks/EnglishTTS.ipynb#scrollTo=jLU2p4Gq_12d中遇到了一个复杂的笔记本,我们可以在其中转换文本到演讲。但是,是否有一种简单的方法可以使用 Google Text to Speech 或 Google Colab 中的其他库?
这样我就提供了一个 String-"My name is XYZ"并在 Colab 笔记本中读出它。(这发生在我提供的链接中,但相当复杂)。
PS 如果可能的话,我希望音频能够自动播放,就像 GTTS 那样。在此笔记本中,我们需要单击“播放”按钮来输出语音。
python text-to-speech google-cloud-platform google-colaboratory gtts
我想使用 SpeechSynthesisUtterance 阅读我的页面文本。
\n\n我找到了这个脚本:https://www.hongkiat.com/blog/text-to-speech/
\n\n几乎完美,但暂停按钮似乎没有多大作用,我希望我能够设置语言,也许还可以选择声音。
\n\n我在这里找到了参考: https: //developer.mozilla.org/en-US/docs/Web/API/SpeechSynthesisUtterance,但我对 JavaScript 不是很了解。
\n\n对于语言,据我了解,应该使用html标签中设置的lang参数。
\n\n对于语音我完全不知道如何在代码中实现它。
\n\n这很重要,因为我有英语、西班牙语、法语和意大利语的文本,而没有语音和语言设置的结果有时听起来很奇怪。
\n\n这些天我摆弄了一下,我设法(或多或少)组合了两个不同的脚本/示例。
\n\n这个:https: //www.hongkiat.com/blog/text-to-speech/
\n\n这是: https: //developer.mozilla.org/en-US/docs/Web/API/SpeechSynthesis#Examples
\n\n出来的代码是这样的:
\n\n超文本标记语言
\n\n<html>\n<head>\n<link rel="stylesheet" href="style.css">\n<script src="text-to-speech.js"></script>\n</head>\n<body>\n<div class=buttons>\n <button id=play></button> \n <button id=pause></button> \n <button id=stop></button>\n</div>\n <select id="voices">\n\n </select>\n<div id="description">\nThe SpeechSynthesis interface of the Web Speech API is the controller interface for the speech service; this can be used to retrieve information about the synthesis voices …Run Code Online (Sandbox Code Playgroud) 是否可以在 iOS 应用程序中自动加载新的语音合成语音?多种高质量的“增强”声音可供下载Settings > Accessibility > Spoken Content > Voices > English。我想使用其中一种高质量的应用程序,但不想向应用程序用户解释他们必须通过深入“设置”导航来手动下载它们。
Siri 声音似乎是我手机上预装的唯一高质量声音,不幸的是 Apple 不允许我们在 AVSpeech\xe2\x80\x8bSynthesizer 中使用这些声音。(选择其中之一作为 AVSpeechSynthesisVoice\xe2\x80\x94 例如
\n\nlet utterance = AVSpeechUtterance(string: "This is a test.")\nutterance.voice = AVSpeechSynthesisVoice(identifier: "com.apple.ttsbundle.siri_female_en-US_premium")\nspeechSynthesizer.speak(utterance)\nRun Code Online (Sandbox Code Playgroud)\n\n没有影响;而是使用质量较低的默认语音。)
\n如果您关注这篇文章https://blog.rasa.com/how-to-build-a-voice-assistant-with-open-source-rasa-and-mozilla-tools/
它会让您从以下位置下载一个 80MB 的文件:
https://drive.google.com/drive/folders/1GU8WGix98WrR3ayjoiirmmbLUZzwg4n0
被称为best_model.pth.tar
并使用https://github.com/mozilla/TTS
你会听到“sara”的声音(非常令人印象深刻)
是否还有其他带有其他预训练声音的 best_model.pth.tar 文件?类似于 CSS 主题,您可以下载一些或免费、付费或非常好的主题,我们是否在某处有预先训练的 TTS 模型目录?
我想用python得到短信的发音。例如,消息“text”应转换为“tekst”,消息“\xd0\xbf\xd1\x80\xd0\xb8\xd0\xb2\xd0\xb5\xd1\x82\”(俄语) 应转换为“privet”。
\n\n我尝试使用googletrans,但实际上没有发音(发音是“无”,我的问题)。
\n\n有人知道这个任务的一些包吗?我用谷歌搜索过但没有结果。我发现了超过 5 个用于将文本转换为语音或文本翻译为语音的软件包,但我不需要音频文件,我只需要发音文本。Phonemizer是非常好的解决方案,但我无法在 Windows 上运行它的后端。
\n\n\npython text-to-speech phonetics google-text-to-speech google-translation-api
我编写了一个函数,它接受 2 个字符串(陈述、问题)并使用Google TTS大声朗读。
我正在使用该flutter_tts: ^1.3.0包并尝试setVoice将扬声器的声音更改为谷歌声音中支持的声音之一的方法:
这是我的代码:
Future _speak(statement, question) async {
flutterTts.setLanguage("cmn-CN");
flutterTts.setVoice("cmn-CN-Standard-B");
flutterTts.setSpeechRate(0.7);
await flutterTts.speak(statement + question);
}
Run Code Online (Sandbox Code Playgroud)
该函数在读取文本时起作用,但我在setVoice该方法上收到错误消息:
D/TTS (12461): Voice name not found: cmn-CN-Standard-B
Run Code Online (Sandbox Code Playgroud)
有人可以帮忙吗?谢谢你!
更新
我意识到我没有使用谷歌 TTS 服务,所以我这样做是为了实现男性和女性的声音。这段代码现在对我有用。
import 'dart:typed_data';
import 'package:http/http.dart' as http;
import 'dart:convert';
import 'package:path_provider/path_provider.dart';
import 'dart:io';
import 'package:audioplayers/audioplayers.dart';
var _apikey = "AIzaSyDWx34PZW0hjSpwExBo5bwrENvyRkLisBE";
AudioPlayer audioPlayer = AudioPlayer();
const String femalevoice = "cmn-CN-Standard-A";
const String malevoice = "cmn-CN-Standard-B";
Future<http.Response> texttospeech(String text, String voicetype) …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用 Web Speech API 来读取网页上的文本。但我发现我的Windows 10中安装的一些SAPI5语音不会显示在输出中speechSynthesis.getVoices(),包括Microsoft Eva MobileWindows 10上通过导入注册表文件“解锁”的语音。这些声音可以在本地 TTS 程序中正常工作Balabolka,但它们只是不会在浏览器中显示。浏览器是否有特定的规则来选择是否列出语音?
也许你们中的一些人也经历过同样的事情:
通过 Javascript使用语音合成时:
const utterance = new SpeechSynthesisUtterance(text);
utterance.addEventListener('start', () => {
console.log("Starting speak!");
});
window.speechSynthesis.speak(utterance);
Run Code Online (Sandbox Code Playgroud)
“开始说话”是在语音真正说话之前 1-4 秒触发的。它在 macOS 上的 safari 上运行良好,但在 Firefox 和 chrome 上都不起作用。