我怎么能区分两个人说话?如果有人说"你好"然后另一个人说"你好"我应该在音频数据中寻找什么样的签名?周期性?
非常感谢能够回答此问题的任何人!
audio speech-recognition signatures
audio ×1
signatures ×1
speech-recognition ×1