ims*_*i17 -1 python unicode concatenation
#!/usr/bin/python\n# -*- coding: utf-8 -*-\n\nimport re\nseparators = [u"\xe0\xa5\xa4", u",", u"."]\ndat=open(r"C:\\Users\\User\\Desktop\\text4.txt",\'r\').read()\ntext=dat.decode("utf-8")\nwros=text.split()\nout=""\nimport string\nspace=" "\ncounter=0;\nfor word in wros:\n out=u" ".join(word)\n\nwrit=open("C:\\\\Users\\\\User\\\\Desktop\\\\text5.txt",\'w\')\nwrit.write(out.encode(\'utf-8\'))\nwrit.close()\nRun Code Online (Sandbox Code Playgroud)\n\ntext4.txt 包含 \xe0\xa4\xad\xe0\xa4\xbe\xe0\xa4\xb0\xe0\xa4\xa4 \xe0\xa4\x95\xe0\xa4\xbe \xe0\xa4\x87\xe0\xa4 \xa4\xe0\xa4\xbf\xe0\xa4\xb9\xe0\xa4\xbe\xe0\xa4\xb8 \xe0\xa4\x95\xe0\xa4\xbe\xe0\xa4\xab\xe0\xa5\x80 \xe0\xa4\xb8\xe0\xa4\xae\xe0\xa5\x83\xe0\xa4\xa6\xe0\xa5\x8d\xe0\xa4\xa7\xe0\xa4\x8f\xe0\xa4\xb5\xe0 \xa4\x82 \xe0\xa4\xb5\xe0\xa4\xbf\xe0\xa4\xb8\xe0\xa5\x8d\xe0\xa4\xa4\xe0\xa5\x83\xe0\xa4\xa4\xe0\xa4 \xb9\xe0\xa5\x88\xe0\xa5\xa4\ntext5.txt 输出为 \xe0\xa4\xb9 \xe0\xa5\x88 \xe0\xa5\xa4
\n\n所需的输出为 \xe0\xa4\xad\xe0\xa4\xbe\xe0\xa4\xb0\xe0\xa4\xa4 \xe0\xa4\x95\xe0\xa4\xbe \xe0\xa4\x87\xe0\xa4\ xa4\xe0\xa4\xbf\xe0\xa4\xb9\xe0\xa4\xbe\xe0\xa4\xb8\xe0\xa4\x95\xe0\xa4\xbe\xe0\xa4\xab\xe0\xa5\x80 \ xe0\xa4\xb8\xe0\xa4\xae\xe0\xa5\x83\xe0\xa4\xa6\xe0\xa5\x8d\xe0\xa4\xa7\xe0\xa4\x8f\xe0\xa4\xb5\xe0\ xa4\x82\xe0\xa4\xb5\xe0\xa4\xbf\xe0\xa4\xb8\xe0\xa5\x8d\xe0\xa4\xa4\xe0\xa5\x83\xe0\xa4\xa4\xe0\xa4\ xb9\xe0\xa5\x88\xe0\xa5\xa4
\n\n请告诉我我所做的事情是错误的?\n需要帮助!提前致谢
\n我认为u"0200"是0200,而不是空间。如果你想使用空间,只需分配space = u" "。
如果您想将这些单词之间用空格连接起来,只需运行:
u" ".join(w)
Run Code Online (Sandbox Code Playgroud)