我目前正在寻找开发一个能够以各种语言阅读文本到语音的小客户端.主要针对英语和日语.
所以我的问题是,有没有人知道一个能够阅读英语和日语的图书馆?
我最初的目标开发语言是c#
谢谢你的时间.
我一直试图弄清楚如何使用Windows SAPI 5.1将文本"说"到内存缓冲区,但到目前为止还没有成功,尽管看起来它应该非常简单.
有一个将合成语音流式传输到.wav文件的示例,但没有关于如何将其流式传输到内存缓冲区的示例.
最后,我需要在16*16位小端PCM格式的char*数组中使用合成语音.目前我创建了一个临时.wav文件,在那里重定向语音输出,然后读取它,但它似乎是一个相当愚蠢的解决方案.
谁知道怎么做?
谢谢!
我在Android市场上有一个相当受欢迎的应用程序,它允许成千上万的用户按下按钮并给它一个语音命令.然后我可以做很多不同的事情,比如给他们当前的天气预报等等......
无论如何,我几乎每天都被我的应用程序的用户询问,他们不想一直按下按钮.他们希望我的应用程序通过触发词(某些特定的单词命令)启动.通过这种方式,应用程序会唤醒并要求他们提供语音命令,所有人都可以免费使用.
我知道这需要一个不间断的听力,它可能是一个电池吃,等等.但我想尝试一下.无论如何,这就是我在这里的原因.我根本就不知道如何去做.
我知道这是可能的,这些家伙做到了,不仅如此,即使手机处于睡眠模式或锁定屏幕后,他们也会听到触发词:http://www.youtube.com/watch?v = Dd2vo_9euOY
关于如何做到这一点的任何想法?上面的人是怎么做到的?怎么样?任何例子?
提前致谢.
我有一个单词列表,我想将文本转换为PhoneGap iPhone的语音功能.TTS有API或插件吗?请让我知道任何替代方案.

我正在尝试使用Chrome文本转语音API,但即使是谷歌https://developer.chrome.com/trunk/extensions/examples/extensions/ttsdemo/ttsdemo.html提供的演示 也不适用于我,我听不到任何声音,是吗?
我不认为这是我的浏览器的问题,因为如果我尝试聆听模式,google.translate.com(我猜这是基于相同的技术)对我有用.
任何的想法?
谢谢
text-to-speech google-chrome-extension google-text-to-speech
问题:在iOS 7.x和iOS 8.x中,此代码运行正常,但在iOS 9.x中,与iOS 7和8中的语音速率相比,语音速度变慢.
self.synthesizer = [[AVSpeechSynthesizer alloc] init];
self.synthesizer.delegate = self;
AVSpeechUtterance *utterance = [[AVSpeechUtterance alloc] initWithString:[NSString stringWithFormat:@"Hey %@, please choose places to explore or select excursions to see our custom crafted deals",[defaults objectForKey:@"USERNAME"]]];
utterance.voice = [AVSpeechSynthesisVoice voiceWithLanguage:@"en-US"];
utterance.rate = 0.10;
[self.synthesizer speakUtterance:utterance];
Run Code Online (Sandbox Code Playgroud) 我在Apple Watch中触发了在后台播放文字转语音的间歇性(aargh!)问题.我已正确设置后台模式,AVSession类别和WatchKitExtensionRequest处理程序.(见下文.)我之前有过这个工作,并且无法弄清楚改变了什么.(可能是iOS 9有问题吗?"之前"意味着,除其他外,iOS 8.)
问题是:当应用程序从Watch获取请求并且应用程序在后台或手机处于休眠状态(已锁定)时,语音有时会立即播放,而其他时间则无法播放,直到应用程序被带来到前台.操作系统似乎有时排队音频,有时不排队.我在成功和失败案例之间找不到任何共同点.我可以登录,要speakUtterance()的调用验证是被造的所有情况.但它的行为有所不同,显然是随机的.唯一的线索是,可能是应用程序在后台运行的时间越长,立即说话的可能性就越小.
这让我脱掉头发.建议欢迎.
所需的背景模式:App使用AirPlay播放音频或流音频/视频
do {
try AVAudioSession.sharedInstance().setCategory(
AVAudioSessionCategoryPlayback,
withOptions:.DuckOthers
)
try AVAudioSession.sharedInstance().setActive(true)
} catch let error as NSError {
// etc...
}
Run Code Online (Sandbox Code Playgroud)
var bgTaskId:UIBackgroundTaskIdentifier = 0
bgTaskId = application.beginBackgroundTaskWithName(
"Prose WKE handler",
expirationHandler: {
application.endBackgroundTask(bgTaskId)
}
)
//... Post notification to call Text-to-Speech
application.endBackgroundTask(bgTaskId)
Run Code Online (Sandbox Code Playgroud) 我想使用Bluemix Conversation 示例应用程序
并向其添加语音输入和输出.Bluemix TTS和STT还有其他示例应用程序可用.有哪些选项可以集成这三个功能,哪些是推荐给初学者的?
text-to-speech speech-to-text ibm-watson watson-conversation ibm-cloud
有人可以告诉我如何使用Watson Conversation和其他服务(例如Twilio)进行实时通话并进行对话吗?
我可以使用Watson Conversation,Twilio和NodeRED通过SMS与聊天机器人进行对话.我还能够创建一个Watson Conversation + Watson Speech-to-Text + Watson Text-to-Speech来创建一个我可以在网络浏览器中讲话的聊天聊天机器人.
Twilio给了我一个电话#我可以用来拨打电话所以必须有一种方法可以连接Watson Conversation + Speech-to-Text + Text-to-Speech + Twilio与聊天机器人进行实时电话交谈.
您可以指示我进行此连接的任何示例也会有所帮助.
text-to-speech speech-to-text twilio ibm-watson watson-conversation
我已经实现了这个Java程序来与Polly一起做TTS:http://docs.aws.amazon.com/polly/latest/dg/examples-java.html
我正在使用荷兰男声,这是好的和自然的,但我发现它有点太快了.我在Polly文档中看到语音速度可以使用SSML中的类似控件进行控制,如本页所示:http: //docs.aws.amazon.com/polly/latest/dg/ssml-synthesize-speech-cli html的
aws polly synthesize-speech \
--text-type ssml \
--text '<speak><prosody rate="x-slow">Hello world</prosody></speak>' \
--output-format mp3 \
--voice-id Joanna \
speech.mp3
Run Code Online (Sandbox Code Playgroud)
但是如何将它合并到我的Java中呢?我试过这个(用于Windows的格式调整):
text = "\<speak><prosody rate='x-slow'>" + text + "</prosody></speak> ^";
PollyDemo helloWorld = new PollyDemo(Region.getRegion(Regions.US_EAST_1));
InputStream speechStream = helloWorld.synthesize(text, OutputFormat.Mp3);
Run Code Online (Sandbox Code Playgroud)
但我在黑暗中摸索.有人可以帮忙吗?谢谢.
text-to-speech ×10
ibm-watson ×2
amazon-polly ×1
android ×1
audio ×1
c# ×1
cordova ×1
ibm-cloud ×1
ios ×1
ios9 ×1
iphone ×1
java ×1
objective-c ×1
sapi ×1
twilio ×1
visual-c++ ×1
xcode7 ×1