将包含 COMBINING DIAERESIS 的文本转换为 utf-8

4 python unicode utf-8

我们有一些包含使用例如'a' + COMBINING DIAERESIS ($cc $88) 表示的德国变音符号的文本。

知道如何将此类文本正确转换为 utf8 吗?

Ign*_*ams 5

首先,如果它还不是,则对其unicode进行解码。其次,unicodedata.normalize()。第三,编码。