字符串编码和格式总是让我困惑。
\n\n这是我所拥有的:
\n\n'\xe0\xb9\x84\xe0\xb8\x97\xe0\xb8\xa2'
\n\n我相信是 UTF-8,并且
\n\n'xn--o3cw4h'
\n\n这应该与 IDNA 编码相同。但是,我不知道如何让 python 从一种转换为另一种。
\n\n我只是在尝试
\n\na = u'xn--o3cw4h'\nb = a.encode('idna')\nb.decode('utf-8')\n
Run Code Online (Sandbox Code Playgroud)\n\n但我得到了完全相同的字符串('xn--o3cw4h',尽管不再是 unicode)。我目前使用的是 python 3.5。
\n