谁能帮我关闭 Google 语音识别器的脏话过滤器?

KKK*_*KKM 6 python google-app-engine speech-to-text

我正在尝试对 wav 进行语音到文本识别。我有 Google、Google_Cloud 和 Houndify 的文件。

我注意到后两者没有出现脏话问题,但 Google 语音识别器会过滤单词,例如 f***、s***。

这给我带来了一个问题,因为我想使用 LIWC 进行情感分析,并且该程序没有为像 f*** 这样过滤的单词提供脏话权重。

我已经尝试过以上所有方法。

(1) 关闭脏话过滤器

recognizer_instance.recognize_google(audio_data: AudioData, key: Union[str, None] = None, language: str = "en-US", , pfilter: Union[0, 1], show_all: bool = False) -> Union[str, Dict[str, Any]]
Run Code Online (Sandbox Code Playgroud)

https://github.com/Uberi/speech_recognition/blob/master/reference/library-reference.rst

(2)从 Google 语音识别中删除脏话审查

但他们都没有解决问题

r.recognize_google(example_audio)
Run Code Online (Sandbox Code Playgroud)

---> 你到底怎么了

但是之后,

r.recognize_google(example_audio, pfilter=0)
Run Code Online (Sandbox Code Playgroud)

给予

TypeError                                 Traceback (most recent call last)
<ipython-input-21-b158a03c879c> in <module>
----> 1 r.recognize_google(example_audio, pfilter=0)

TypeError: recognize_google() got an unexpected keyword argument 'pfilter'
Run Code Online (Sandbox Code Playgroud)

我应该如何解决这个问题?

我知道 Stackoverflow 上编写的许多解决方案都引用了 Google Cloud API 的识别器。我确实有 Google_Cloud ( r.recognize_google_cloud) 工作,所以我想要一个针对 recognize_google 而不是 Google Cloud 的解决方案。我想比较一下结果。

小智 0

我正在打同样的事情。在这里查看 github 中的代码https://github.com/Uberi/speech_recognition/blob/master/speech_recognition/ init .py我可以看到支持 pfilter 参数,正如文档所示,但我从那里获得的版本pip install,也声称是3.8.1,只是删除了pfilter。

然而,看一下实现,它只是影响是否 "pfilter": 0 | 1 被添加到请求的字典中,因此只需在本地编辑您的副本以将其添加到字典中就是前进的一种途径。

出现这种不一致非常令人沮丧:(