使用Windows 7在Sublime Text 2的控制台中打印utf-8字符串

Bas*_*asj 5 python windows encoding utf-8 sublimetext

python myscript.py从Windows控制台cmd.exe(即Sublime Text 之外)运行此代码时,它的工作原理如下:

# coding: utf8
import json
d = json.loads("""{"mykey": {"readme": "Café"}}""")
print d['mykey']['readme']
Run Code Online (Sandbox Code Playgroud)

咖啡店

在Sublime Text 2中运行时CTRL+B,它会失败:

  • 这样(默认情况下):

    print d ['mykey'] ['readme']
    UnicodeEncodeError:'ascii'编解码器无法对位置3中的字符u'\ xe9'进行编码:序数不在范围内(128)
    [以0.1秒结束,退出代码为1]

  • 或者像这样,在使用Sublime Text 3(即在构建系统中添加)在Python 3打印UTF-8的答案应用解决方案之后:cmd.exe

    [解码错误 - 输出不是utf-8]
    [解码错误 - 输出不是utf-8]
    [以0.1秒完成]

  • 添加"env": {"PYTHONIOENCODING": "utf8"},Python Sublime-build文件也无济于事

如何"encoding": "utf-8"正确使用Sublime Text 2(适用于Windows)控制台,如果它包含一些UTF8字符?

注意:这不是使用Sublime Text 3在Python 3打印UTF-8的重复,我之前已经链接到这个问题.

这是print文件:

{ "cmd": ["python", "-u", "$file"],
"file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
"selector": "source.python" }
Run Code Online (Sandbox Code Playgroud)

(我和没有Python.sublime-build,有和没有尝试过"env": ...)

Oda*_*urd 5

这是一个很长的答案,充满了血淋淋的细节,但 TL;DR 版本是,这似乎是 Sublime Text 2 中的一个错误(特别是在它的exec命令中)。

\n\n

如果无法升级到 Sublime Text 3,下面有关于如何修补 Sublime 的说明,以便潜在地解决问题(至少在我的所有测试中都有效),因为 Sublime 3 有一个增强的命令exec

\n\n
\n\n

需要注意的是,您看到的错误形式如下:

\n\n
\n

[解码错误-输出不是utf-8]

\n
\n\n

由 Sublime 生成,因为它将数据添加到输出面板,而不是由 Python 生成。即使进行了下面概述的修复,可能仍然需要(根据系统设置和/或使用的平台)包含env问题中提到的设置,因为这会告诉 Python 以 UTF-8 生成输出,无论它是什么认为应该做。

\n\n
\n\n

为了进行以下测试,我在 Windows 7 计算机上安装了 Sublime Text 2 和 Python 2.7.14。这台机器上已经安装了 Python 3 并添加到了PATH,所以我按照示例构建文件中的指示安装了这个版本C:\\Python27-64,并将其保留在路径之外。

\n\n

除了安装PackageResourceViewer和提高默认字体大小之外,Sublime 在其他方面都是普通的。

\n\n

测试脚本如下,对您问题中概述的版本稍作修改:

\n\n
# coding: utf8\nimport sys\n\nprint(sys.version)\nprint("Caf\xc3\xa9")\n
Run Code Online (Sandbox Code Playgroud)\n\n

由于一切都是库存,因此中的构建系统Tools > Build System设置为Automatic,并尝试运行构建,Ctrl+B会产生以下输出:

\n\n
3.6.0 (v3.6.0:41df79263a11, Dec 23 2016, 08:06:12) [MSC v.1900 64 bit (AMD64)]\n[Decode error - output not utf-8]\n[Finished in 0.1s]\n
Run Code Online (Sandbox Code Playgroud)\n\n

这是有道理的,因为如上所述,Python 3 在我的路径上,但 Python 2 不在我的路径上,因此它选择了 Python 3。

\n\n

默认值Python.sublime-build如下:

\n\n
3.6.0 (v3.6.0:41df79263a11, Dec 23 2016, 08:06:12) [MSC v.1900 64 bit (AMD64)]\n[Decode error - output not utf-8]\n[Finished in 0.1s]\n
Run Code Online (Sandbox Code Playgroud)\n\n

我使用 PackgeResourceViewer 打开该文件并修改它以直接调用 Python 2 解释器:

\n\n
{\n    "cmd": ["python", "-u", "$file"],\n    "file_regex": "^[ ]*File \\"(...*?)\\", line ([0-9]*)",\n    "selector": "source.python"\n}\n
Run Code Online (Sandbox Code Playgroud)\n\n

完成此操作后,构建结果如下所示:

\n\n
2.7.14 (v2.7.14:84471935ed, Sep 16 2017, 20:25:58) [MSC v.1500 64 bit (AMD64)]\nCaf\xc3\xa9\n[Finished in 0.1s]\n
Run Code Online (Sandbox Code Playgroud)\n\n

请注意,它正在运行 Python 2,但它现在也可以正确显示数据,而无需修改任何内容。

\n\n

这有点奇怪,我必须承认我在这方面陷入了一些困境,因为它似乎立刻就起作用了。但是,如果您注释掉以下打印内容sys.version

\n\n
{\n    "cmd": ["C:\\\\Python27-64\\\\python.exe", "-u", "$file"],\n    "file_regex": "^[ ]*File \\"(...*?)\\", line ([0-9]*)",\n    "selector": "source.python"\n}\n
Run Code Online (Sandbox Code Playgroud)\n\n

它停止工作:

\n\n
[Decode error - output not utf-8]\n[Decode error - output not utf-8]\n[Finished in 0.1s]\n
Run Code Online (Sandbox Code Playgroud)\n\n

或者,如果您稍微修改正在打印的文本,使其不会以重音字符结尾:

\n\n
2.7.14 (v2.7.14:84471935ed, Sep 16 2017, 20:25:58) [MSC v.1500 64 bit (AMD64)]\nCaf\xc3\xa9\n[Finished in 0.1s]\n
Run Code Online (Sandbox Code Playgroud)\n\n

现在它按照您的预期工作:

\n\n
Caf\xc3\xa9 au lait\n[Finished in 0.1s]\n
Run Code Online (Sandbox Code Playgroud)\n\n

我认为这是execSublime Text 包中附带的命令中的一个错误Default。特别是,它在将数据插入构建结果之前对数据进行解码,因此对读取数据时发生缓冲区截止的位置可能很敏感。

\n\n

相反,Sublime Text 3 有该命令的修改版本exec(以及其他增强功能),它在从管道读取数据的位置使用增量解码器,并且不会出现此问题。

\n\n

修改execSublime 2 中的命令以也使用增量解码似乎可以解决该问题,尽管我承认我没有对此进行任何详尽的测试。

\n\n

我创建了一个公共要点,其中包含文件的修改版本exec.py,该文件提供exec构建系统使用的命令以及有关如何应用它的说明。

\n\n

如果你使用它,你现有的构建系统(甚至是默认的)应该可以为你找到工作,除非我上面提到你可能仍然需要使用env构建中的设置来强制Python解释器实际输出UTF-8情况并非如此。

\n


Bas*_*asj 1

我找到了一个可能的修复方法:encodingPython.sublime-build文件中添加参数:

{
"cmd": ["python", "-u", "$file"],
"file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
"selector": "source.python",
"encoding": "cp1252",
...
Run Code Online (Sandbox Code Playgroud)

注意:"encoding": "latin1"似乎也可以工作,但是 - 我不知道为什么 -"encoding": "utf8"不起作用,即使 .py 文件是 UTF8,即使 Python 3 使用 UTF8 等。神秘!


编辑:这现在有效:

{
  "cmd": ["python", "-u", "$file"],
  "file_regex": "^[ ]*File \"(...*?)\", line ([0-9]*)",
  "selector": "source.python",
  "encoding": "utf8",
  "env": {"PYTHONIOENCODING": "utf-8", "LANG": "en_US.UTF-8"},
}
Run Code Online (Sandbox Code Playgroud)

链接主题: