问题的简短版本:我正在寻找一种在 Linux 上运行并且具有不错的准确性和可用性的语音识别软件。任何许可证和价格都可以。它不应该仅限于语音命令,因为我希望能够口述文本。
更多细节:
我不满意地尝试了以下内容:
上述所有原生 Linux 解决方案的准确性和可用性都很差(或者一些不允许自由文本听写而只允许语音命令)。我所说的准确度差是指准确度远低于我在下面提到的其他平台的语音识别软件的准确度。至于 Wine + Dragon NaturallySpeaking,根据我的经验,它一直崩溃,不幸的是,我似乎并不是唯一一个遇到此类问题的人。
在 Microsoft Windows 上,我使用 Dragon NaturallySpeaking,在 Apple Mac OS XI 上使用 Apple Dictation 和 DragonDictate,在 Android 上我使用 Google 语音识别,在 iOS 上我使用内置的 Apple 语音识别。
百度研究昨天发布了其语音识别库的 …
背景:
多年来,我一直在应对慢性 RSI,并且正在研究各种不用手控制计算机的选项。Linux 已经成为我的操作系统几年了,如果可以的话我真的不想回到 Windows,但如果我很快找不到任何东西,我将不得不数我的筹码,因为我已经花了看了好几个小时。
这肉:
特别是,我正在寻找带有头部跟踪的眼睛注视跟踪(最好在同一程序中),但我会考虑将手势技术作为补充程序。任何价格都可以,但免费和开源总是好的。如果您有任何推荐的跟踪硬件,请提供您的建议。由于当您注视固定点时,眼睛会自然地抖动(或扫视),因此该技术的优点是眼睛注视跟踪的速度和头部跟踪的单像素精度。我将使用它和语音识别堆栈来控制我的计算机甚至代码。
我发现 Precision Gaze Mouse 可与 Eviacam 配合使用,但不幸的是 Precison Gaze Mouse 目前仅适用于 Windows。我正在寻找类似这样的组合。下面链接中的 Precision Gaze Mouse 视频演示了其工作原理。以下是参考链接: