我的 json 文件中有以下文本:
\n\n"\\u00d7\\u0090\\u00d7\\u0097\\u00d7\\u0095\\u00d7\\u0096\\u00d7\\u00aa \n\\u00d7\\u00a4\\u00d7\\u0095\\u00d7\\u009c\\u00d7\\u0092"\nRun Code Online (Sandbox Code Playgroud)\n\n它表示希伯来语中的文本“\xd7\x90\xd7\x97\xd7\x95\xd7\x96\xd7\xaa \xd7\xa4\xd7\x95\xd7\x9c\xd7\x92”。
\n\n无论我使用哪种编码/解码,我似乎都无法正确使用 Python 3。
\n\n例如,如果我尝试:
\n\ntext = "\\u00d7\\u0090\\u00d7\\u0097\\u00d7\\u0095\\u00d7\\u0096\\u00d7\\u00aa \n\\u00d7\\u00a4\\u00d7\\u0095\\u00d7\\u009c\\u00d7\\u0092".encode(\'unicode-escape\')\n\nprint(text)\nRun Code Online (Sandbox Code Playgroud)\n\n我得到的文字是:
\n\nb\'\\\\xd7\\\\x90\\\\xd7\\\\x97\\\\xd7\\\\x95\\\\xd7\\\\x96\\\\xd7\\\\xaa \\\\xd7\\\\xa4\\\\xd7\\\\x95\\\\xd7\\\\x9c\\\\xd7\\\\x92\'\nRun Code Online (Sandbox Code Playgroud)\n\n如果我能够仅删除一个反斜杠并转过来,这在字节码中几乎是正确的文本
\n\nb\'\\\\xd7\\\\x90\\\\xd7\\\\x97\\\\xd7\\\\x95\\\\xd7\\\\x96\\\\xd7\\\\xaa \\\\xd7\\\\xa4\\\\xd7\\\\x95\\\\xd7\\\\x9c\\\\xd7\\\\x92\'\nRun Code Online (Sandbox Code Playgroud)\n\n进入
\n\ntext = b\'\\xd7\\x90\\xd7\\x97\\xd7\\x95\\xd7\\x96\\xd7\\xaa \\xd7\\xa4\\xd7\\x95\\xd7\\x9c\\xd7\\x92\'\nRun Code Online (Sandbox Code Playgroud)\n\n(注意我如何将双斜杠更改为单斜杠)然后
\n\ntext.decode(\'utf-8\')\nRun Code Online (Sandbox Code Playgroud)\n\n将产生正确的希伯来语文本。
\n\n但我正在努力这样做,并且无法设法创建一段代码来为我做到这一点(而不是像我刚刚展示的那样手动......)
\n\n非常感谢任何帮助...
\n