我想建立新的声学模型,新词典,新语言模型为" Sinhala Language speech recognition"僧伽罗语言字符是基于Unicode的.例如A =අ,I =ඉ,U =උ,KA =ක,BA =බ.我确实通过了CMUSphinx开发人员教程.但它没有帮助我.它适用于英语.
Sinhala Language speech recognition
语言模型应该是ARPA模型.如何将Sinhala Unicode与英语音素映射,以及如何使用不同的声音训练语言模型.有没有可用于生成基于Unicode的语言模型的工具?
speech-recognition sphinx4 cmusphinx
cmusphinx ×1
speech-recognition ×1
sphinx4 ×1