问题是我想用C#语言获取音频语音的音素.假设你有一个像"x.wav"这样的音频文件,上面写着"你好亲爱的Shamim".我想提取演讲的所有音素和他们的相对时间.如下图所示:

我使用了System.Speech库(两者recognition和synthesis命名空间),但我找不到我想要的东西.现在别搞错了!我不想要句子的语句"亲爱的Shamim",我想从未知的音频输入中提取音素和英语句子.我试过System.Speech.Recognition但它试图从音频文件中提取出来的话,而不是手机!正如你可能猜到的那样,30%的错误!;)
在我的C#控制台应用程序中,我提示用户插入IP地址:
string strIpAddress;
Console.WriteLine("Type the IP Address:");
strIpAddress = Console.ReadLine();
Run Code Online (Sandbox Code Playgroud)
输出看起来像这样:
我想在控制台上准备好默认IP地址文本,以供用户查看,然后按Enter。如果默认IP无效,则用户应该能够删除文本(带有Backspace),更正IP地址,然后按Enter。用户应该看到如下内容:
我不知道该怎么做!;-(
感谢您的任何建议。