我正在寻找PHP语音识别.
我有很多wav文件(10-15秒),我希望语音识别能够识别每个wav文件中的1或2个单词,然后将其标记为数据库或csv.
所有文件都有相同的声音和口音(同一个人哈哈)
示例伪代码:
$voice = new play('file.wav');
$result = $voice->recognise("Good Morning");
if ($result) {
echo "Matched Good Morning";
//flag to database or csv
} else {
echo "No match found";
}
Run Code Online (Sandbox Code Playgroud)
哪个PHP语音识别库可以做到这一点?
我一直在寻找几个支持android的语音识别库,但没有一个没有服务器调用或没有使用互联网.我的要求是检测一些特定的关键字并相应地执行一些操作而不需要互联网,即关键字分析应该在本地完成.那么有没有能够这样做的语音识别库.CMU Sphinx是人们认为可以实现这一目标的唯一工具包,但它仍然需要一种算法来识别语音中的关键字.
我正在开发一个功能,当按下按钮时,它将启动语音识别,同时记录用户说的内容.代码如下:
button_start.setOnTouchListener( new View.OnTouchListener()
{
@Override
public boolean onTouch(View arg0, MotionEvent event)
{
if (pressed == false)
{
Intent intent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH);
intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_MODEL,RecognizerIntent.LANGUAGE_MODEL_FREE_FORM);
intent.putExtra(RecognizerIntent.EXTRA_CALLING_PACKAGE,"voice.recognition.test");
intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE, "zh-HK");
intent.putExtra(RecognizerIntent.EXTRA_MAX_RESULTS,1);
sr.startListening(intent);
Log.i("111111","11111111");
pressed = true;
}
recordAudio();
}
if((event.getAction()==MotionEvent.ACTION_UP || event.getAction()==MotionEvent.ACTION_CANCEL))
{
stopRecording();
}
return false;
}
});
}
public void recordAudio()
{
isRecording = true;
try
{
mediaRecorder = new MediaRecorder();
mediaRecorder.setAudioSource(MediaRecorder.AudioSource.MIC);
mediaRecorder.setOutputFormat(MediaRecorder.OutputFormat.THREE_GPP);
mediaRecorder.setOutputFile(audioFilePath);
mediaRecorder.setAudioEncoder(MediaRecorder.AudioEncoder.AMR_NB);
mediaRecorder.prepare();
}
catch (Exception e)
{
e.printStackTrace();
}
mediaRecorder.start();
}
public void stopRecording()
{
if (isRecording) …Run Code Online (Sandbox Code Playgroud) 我想要实现的内容非常简单:我希望用户从列表中选择一个项目并在应用程序中获取结果,就像RemoteInput.setChoices(不幸的是仅限于手表).
以下是需要与手表对话的代码,但我想在手机上实现此功能.
任何的想法?
我正在做和做的应用程序:
1:如果麦克风检测到某些噪音,它会开始录制音频,直到没有检测到噪音.之后,音频被录制到wav文件中.
2:我必须在上面检测一些字.只有5到10个字可供检测.
到目前为止,我的代码只执行第一部分(检测噪声和录制音频).现在,我有一个包含以下单词的列表:help, please, yes, no, could, you, after, tomorrow.我需要一种离线方式来检测我的声音是否包含这些单词.这可能吗?我怎样才能做到这一点?我正在使用linux,无法将我的操作系统更改为Windows或使用虚拟机.
我正在考虑使用声音的频谱图,创建一个火车数据库并使用一些分类器进行预测.例如,这是一个单词的谱图.这是一个很好的技术吗?
谢谢.
我正在使用自定义命令创建像"Ok Google"这样的语音识别服务.为此,我使用了VoiceInteractionService,我从这里引用了代码.另外,我收到了STATE_HARDWARE_UNAVAILABLE错误onAvailabilityChanged.
public class VoiceCommandService extends VoiceInteractionService {
private static final String TAG = "AlwaysOnHotwordDetector";
Locale locale = new Locale("en-US");
protected SpeechRecognizer mSpeechRecognizer;
protected Intent mSpeechRecognizerIntent;
public final Callback mHotwordCallback = new Callback() {
@Override
public void onAvailabilityChanged(int status) {
Log.i(TAG, "onAvailabilityChanged(" + status + ")");
hotwordAvailabilityChangeHelper(status);
}
@Override
public void onDetected(EventPayload eventPayload) {
Log.i(TAG, "onDetected");
}
@Override
public void onError() {
Log.i(TAG, "onError");
}
@Override
public void onRecognitionPaused() {
Log.i(TAG, "onRecognitionPaused"); …Run Code Online (Sandbox Code Playgroud) 我正在开发一个基于语音的AI的iOS应用程序; 即它意味着从麦克风接收语音输入,将其转换为文本,将其发送到AI代理,然后通过扬声器输出返回的文本.我已经完成了所有工作,但是使用按钮开始和停止录制语音(SpeechKit用于语音识别,API.AI用于AI,亚马逊的Polly用于输出).
我需要的是让麦克风始终打开,并在用户开始和结束谈话时自动开始和停止录制用户的声音.这个应用程序正在开发一个非正统的环境,在那里将无法访问用户的屏幕(但他们将有一个用于录制文本的高端霰弹枪麦克风).
我的研究表明,这个难题被称为"语音活动检测",似乎是整个基于语音的AI系统中最困难的步骤之一.
我希望有人可以提供一些简单的(Swift)代码来自己实现,或者指向我可以在这个项目中实现的一些像样的库/ SDK的方向.
artificial-intelligence voice-recording voice-recognition ios swift
我正在寻找API将口语项目转换为iOS上的文本,但主要用于数字和字母,如1,2,3,4和a,b,c,d.
我已经像许多人建议的那样尝试过OpenEars,但它似乎只支持某些ords,例如"GO FORWARD BACKWARD LEFT RIGHT START STOP TURN".它可以用于识别通用词或口语数字吗?
我也尝试过iSpeech API,但是当我说一串像12345这样的数字时,它只能返回"一二三四五"的文字,它只能给我识别的结果而不是一个猜测列表(如Android上的Google语音识别API).
我如何使用这些API(或其他替代方法)来识别口头数字或字母?
我猜这个问题几乎说明了一切?
我宁愿不访问Microsoft Translator和Project Hawaii等云服务?
我可以访问任何直接的API吗?
(对于metro应用程序)
windows text-to-speech speech-to-text voice-recognition windows-8
我正在寻找一个C++语音识别/语音识别API.我经历了很少,包括VOCE和pocketphenix.但这是我的要求
VOCE api似乎没有提供我要求的东西,而pocketphenix似乎非常复杂.该API将与QT一起使用 - 最新版本与Visual Studio 2010编译器一起使用.
我听说过Microsoft提供的API,但我愿意尽可能远离Microsoft API.
我正在使用MS Windows 7终极版,所以如果API适用于Windows就足够了.
如果开源,API应该是免费的,因为我将在大学的最后一年项目中使用它.
c++ voice speech-recognition artificial-intelligence voice-recognition