SyntaxError:文件中以“\xd8”开头的非 UTF-8 代码

Mor*_*a M 4 python printing utf-8 python-3.x

我使用波斯语网站来爬行网站,并使用 lxml 库和我的 python 3.4 代码获取数据和文本。此时一切都很好

\n\n
text = "[\'\xd9\x87\xd9\x88\xd8\xa7\xd8\xaf\xd8\xa7\xd8\xb1\xd8\xa7\xd9\x86 \xd8\xa7\xd8\xb3\xd8\xaa\xd9\x82\xd9\x84\xd8\xa7\xd9\x84 \xd8\xa7\xd8\xb2 \xd9\x86\xd8\xae\xd8\xb3\xd8\xaa\xdb\x8c\xd9\x86 \xd8\xb3\xd8\xa7\xd8\xb9\xd8\xa7\xd8\xaa \xd8\xb5\xd8\xa8\xd8\xad \xd8\xa7\xd9\x85\xd8\xb1\xd9\x88\xd8\xb2 \xd8\xb1\xd8\xa7\xd9\x87\xdb\x8c \xd9\x88\xd8\xb1\xd8\xb2\xd8\xb4\xda\xaf\xd8\xa7\xd9\x87 \xd8\xa2\xd8\xb2\xd8\xa7\xd8\xaf\xdb\x8c \xd8\xb4\xd8\xaf\xd9\x86\xd8\xaf.\', \'\xd8\xa8\xd9\x87 \xda\xaf\xd8\xb2\xd8\xa7\xd8\xb1\xd8\xb4 \xda\xa9\xd8\xa7\xd9\xbe\xd8\x8c \xd8\xaf\xd8\xb1 \xd8\xb4\xd8\xb1\xd8\xa7\xdb\x8c\xd8\xb7\xdb\x8c \xda\xa9\xd9\x87 \xd8\xa8\xd8\xa7\xd8\xb2\xdb\x8c \xd8\xa7\xd9\x85\xd8\xb1\xd9\x88\xd8\xb2 \xd8\xa7\xd8\xb3\xd8\xaa\xd9\x82\xd9\x84\xd8\xa7\xd9\x84 \xd9\x88 \xd8\xa7\xd9\x84\xd8\xa7\xd9\x87\xd9\x84\xdb\x8c \xd8\xa7\xd9\x85\xd8\xa7\xd8\xb1\xd8\xa7\xd8\xaa \xd8\xa7\xd8\xb2 \xd8\xb3\xd8\xa7\xd8\xb9\xd8\xaa 20:15 \xd8\xaf\xd8\xb1 \xd9\x88\xd8\xb1\xd8\xb2\xd8\xb4\xda\xaf\xd8\xa7\xd9\x87 \xd8\xa2\xd8\xb2\xd8\xa7\xd8\xaf\xdb\x8c \xd8\xa2\xd8\xba\xd8\xa7\xd8\xb2 \xd9\x85\xdb\x8c \xd8\xb4\xd9\x88\xd8\xaf\xd8\x8c \xd8\xaf\xd8\xb1 \xd9\x81\xd8\xa7\xd8\xb5\xd9\x84\xd9\x87 \xda\xa9\xd9\x85\xd8\xaa\xd8\xb1 \xd8\xa7\xd8\xb2 8 \xd8\xb3\xd8\xa7\xd8\xb9\xd8\xaa \xd8\xaa\xd8\xa7 \xd8\xb4\xd8\xb1\xd9\x88\xd8\xb9 \xd9\x85\xd8\xb3\xd8\xa7\xd8\xa8\xd9\x82\xd9\x87\xd8\x8c \xd8\xaa\xd8\xb9\xd8\xaf\xd8\xa7\xd8\xaf\xdb\x8c \xd8\xa7\xd8\xb2 \xd9\x87\xd9\x88\xd8\xa7\xd8\xaf\xd8\xa7\xd8\xb1\xd8\xa7\xd9\x86 \xd8\xa2\xd8\xa8\xdb\x8c \xd9\xbe\xd9\x88\xd8\xb4 \xd9\x85\xd9\x82\xd8\xa7\xd8\xa8\xd9\x84 \xd8\xaf\xd8\xb1\xd8\xa8 \xd8\xba\xd8\xb1\xd8\xa8\xdb\x8c \xd8\xa2\xd8\xb2\xd8\xa7\xd8\xaf\xdb\x8c \xd8\xac\xd9\x85\xd8\xb9 \xd8\xb4\xd8\xaf\xd9\x87 \xd8\xa7\xd9\x86\xd8\xaf.\', \'\xd8\xa7\xd9\x84\xd8\xa8\xd8\xaa\xd9\x87 \xd8\xaf\xd8\xb1\xd9\x87\xd8\xa7\xdb\x8c \xd9\x88\xd8\xb1\xd8\xb2\xd8\xb4\xda\xaf\xd8\xa7\xd9\x87 \xd8\xa2\xd8\xb2\xd8\xa7\xd8\xaf\xdb\x8c \xd9\x87\xd9\x86\xd9\x88\xd8\xb2 \xd8\xa8\xd8\xa7\xd8\xb2 \xd9\x86\xd8\xb4\xd8\xaf\xd9\x87 \xd9\x88 \xd8\xa8\xd9\x84\xdb\x8c\xd8\xaa \xd9\x81\xd8\xb1\xd9\x88\xd8\xb4\xdb\x8c \xd9\x86\xdb\x8c\xd8\xb2 \xd8\xb5\xd9\x88\xd8\xb1\xd8\xaa \xd9\x86\xda\xaf\xd8\xb1\xd9\x81\xd8\xaa\xd9\x87 \xd8\xa7\xd8\xb3\xd8\xaa.\', \'\xd8\xa8\xd9\x84\xdb\x8c\xd8\xaa \xd9\x81\xd8\xb1\xd9\x88\xd8\xb4\xdb\x8c \xd8\xa8\xd8\xa7\xd8\xb2\xdb\x8c \xd8\xa7\xd9\x85\xd8\xb1\xd9\x88\xd8\xb2 \xd8\xa8\xd9\x87 \xd8\xb5\xd9\x88\xd8\xb1\xd8\xaa \xd8\xad\xd8\xb6\xd9\x88\xd8\xb1\xdb\x8c \xd8\xa7\xd9\x86\xd8\xac\xd8\xa7\xd9\x85 \xd9\x85\xdb\x8c \xd8\xb4\xd9\x88\xd8\xaf \xd9\x88 \xd8\xa8\xd9\x87 \xd9\x87\xd9\x85\xdb\x8c\xd9\x86 \xd8\xaf\xd9\x84\xdb\x8c\xd9\x84 \xd8\xa7\xd8\xb3\xd8\xaa\xd9\x82\xd9\x84\xd8\xa7\xd9\x84\xdb\x8c \xd9\x87\xd8\xa7 \xd9\x85\xd8\xac\xd8\xa8\xd9\x88\xd8\xb1 \xd9\x87\xd8\xb3\xd8\xaa\xd9\x86\xd8\xaf \xd8\xa8\xd8\xb1\xd8\xa7\xdb\x8c \xd8\xa7\xd8\xb3\xd8\xaa\xd9\x82\xd8\xb1\xd8\xa7\xd8\xb1 \xd8\xaf\xd8\xb1 \xd8\xac\xd8\xa7\xdb\x8c \xd8\xa8\xd9\x87\xd8\xaa\xd8\xb1\xd8\x8c \xd8\xb2\xd9\x88\xd8\xaf\xd8\xaa\xd8\xb1 \xd8\xaf\xd8\xb1 \xd9\x88\xd8\xb1\xd8\xb2\xd8\xb4\xda\xaf\xd8\xa7\xd9\x87 \xd8\xad\xd8\xa7\xd8\xb6\xd8\xb1 \xd8\xb4\xd9\x88\xd9\x86\xd8\xaf.\', \'\xd9\x87\xd9\x85\xda\x86\xd9\x86\xdb\x8c\xd9\x86 \xd8\xaa\xd8\xb9\xd8\xaf\xd8\xa7\xd8\xaf\xdb\x8c \xd8\xa7\xd8\xb2 \xd9\x84\xdb\x8c\xd8\xaf\xd8\xb1\xd9\x87\xd8\xa7\xdb\x8c \xd8\xa7\xd8\xb3\xd8\xaa\xd9\x82\xd9\x84\xd8\xa7\xd9\x84 \xd9\x86\xdb\x8c\xd8\xb2 \xd8\xb5\xd8\xa8\xd8\xad \xd8\xb1\xd9\x88\xd8\xb2 xa0\xd8\xa8\xd8\xa7\xd8\xb2\xdb\x8c \xd8\xaf\xd8\xb1 \xd8\xad\xd8\xa7\xd9\x84 \xd8\xaa\xd8\xb1\xd9\x85\xdb\x8c\xd9\x85 \xd9\x88 \xd8\xaa\xda\xa9\xd9\x85\xdb\x8c\xd9\x84 \xd8\xb7\xd8\xb1\xd8\xad \xd9\x85\xd9\x88\xd8\xb2\xd8\xa7\xdb\x8c\xdb\x8c\xda\xa9\xdb\x8c \xd8\xae\xd9\x88\xd8\xaf \xd8\xa8\xd9\x88\xd8\xaf\xd9\x86\xd8\xaf \xda\xa9\xd9\x87 \xd8\xaf\xdb\x8c\xd8\xb1\xd9\x88\xd8\xb2 \xd8\xa8\xd9\x87 \xd8\xaf\xd9\x84\xdb\x8c\xd9\x84 \xd8\xb7\xd9\x88\xd9\x81\xd8\xa7\xd9\x86 \xd8\xaa\xd9\x87\xd8\xb1\xd8\xa7\xd9\x86 \xd8\xaa\xd8\xb9\xd8\xaf\xd8\xa7\xd8\xaf\xdb\x8c \xd8\xa7\xd8\xb2 \xd9\x82\xd8\xb7\xd8\xb9\xd8\xa7\xd8\xaa \xd8\xa2\xd9\x86 \xda\xa9\xd9\x86\xd8\xaf\xd9\x87 \xd8\xb4\xd8\xaf\xd9\x87 \xd8\xa8\xd9\x88\xd8\xaf.\']\xd9\x86\xdb\x8c\xd9\x88\xda\xa9\xd8\xa7\xd8\xb3\xd9\x84 \xd8\xaa\xd9\x88\xd8\xa7\xd9\x86\xd8\xb3\xd8\xaa \xd8\xa8\xd9\x87 \xd9\x84\xdb\x8c\xda\xaf \xd8\xa8\xd8\xb1\xd8\xaa\xd8\xb1 \xd8\xa7\xd9\x86\xda\xaf\xd9\x84\xdb\x8c\xd8\xb3 \xd8\xb5\xd8\xb9\xd9\x88\xd8\xaf \xda\xa9\xd9\x86\xd8\xaf.\xd8\xa8\xd9\x87 \xda\xaf\xd8\xb2\xd8\xa7\xd8\xb1\xd8\xb4 \xda\xa9\xd8\xa7\xd9\xbe\xd8\x8c \xd8\xaf\xd9\x88\xd8\xb4\xd9\x86\xd8\xa8\xd9\x87 \xd8\xb4\xd8\xa8 \xd9\x86\xdb\x8c\xd9\x88\xda\xa9\xd8\xa7\xd8\xb3\xd9\x84 \xd8\xaa\xd9\x88\xd8\xa7\xd9\x86\xd8\xb3\xd8\xaa \xd9\xbe\xd8\xb1\xd8\xb3\xd8\xaa\xd9\x88\xd9\x86 \xd9\x86\xd9\x88\xd8\xb1\xd8\xab \xd8\xa7\xd9\x86\xd8\xaf \xd8\xb1\xd8\xa7 \xd8\xa8\xd8\xa7 \xd9\x86\xd8\xaa\xdb\x8c\xd8\xac\xd9\x87 4 \xd8\xa8\xd8\xb1 \xdb\x8c\xda\xa9 \xd8\xb4\xda\xa9\xd8\xb3\xd8\xaa \xd8\xaf\xd8\xa7\xd8\xaf\xd9\x87 \xd9\x88 \xd8\xa8\xd9\x87 \xd9\x84\xdb\x8c\xda\xaf \xd8\xa8\xd8\xb1\xd8\xaa\xd8\xb1 \xd8\xa7\xd9\x86\xda\xaf\xd9\x84\xdb\x8c\xd8\xb3 \xd8\xb5\xd8\xb9\xd9\x88\xd8\xaf \xda\xa9\xd9\x86\xd8\xaf.\xd8\xa8\xd9\x87 \xd8\xa7\xdb\x8c\xd9\x86 \xd8\xaa\xd8\xb1\xd8\xaa\xdb\x8c\xd8\xa8 \xd8\xb1\xd8\xa7\xd9\x81\xd8\xa7\xd8\xa6\xd9\x84 \xd8\xa8\xd9\x86\xdb\x8c\xd8\xaa\xd8\xb2 \xd9\x81\xd8\xb5\xd9\x84 \xd8\xa8\xd8\xb9\xd8\xaf \xd8\xaf\xd8\xb1 \xd9\x84\xdb\x8c\xda\xaf \xd8\xa8\xd8\xb1\xd8\xaa\xd8\xb1 \xd8\xac\xd8\xb2\xdb\x8c\xd8\xb1\xd9\x87 \xd9\x81\xd8\xb9\xd8\xa7\xd9\x84\xdb\x8c\xd8\xaa \xd8\xae\xd9\x88\xd8\xa7\xd9\x87\xd8\xaf \xda\xa9\xd8\xb1\xd8\xaf."\n#print2file(title, text, 14)\n#u = unicode(text, "utf-8")\nprint(text)\n
Run Code Online (Sandbox Code Playgroud)\n\n

错误:

\n\n
SyntaxError: Non-UTF-8 code starting with \'\\xd8\' in file D:/Users/Documents/PyCharm/WEB/Crawler-04.py on line 74, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details\n
Run Code Online (Sandbox Code Playgroud)\n\n

代码

\n

小智 5

将此行放在代码的第一行:

# This Python file uses the following encoding: utf-8
Run Code Online (Sandbox Code Playgroud)

更多信息:www.python.org/dev/peps/pep-0263/#examples