UnicodeDecodeError: 'charmap' 编解码器无法解码位置 55 中的字节 0x81：字符映射到 <undefined>

Question

UnicodeDecodeError: 'charmap' 编解码器无法解码位置 55 中的字节 0x81：字符映射到 <undefined>

use*_*908 4 python decode syntax-error spss

我是 Python 新手，希望有人可以向我解释错误消息的含义。

具体来说，我有一些Python和SPSS组合在一起的代码保存在Atom中，这是一个前同事创建的。现在因为前同事不在了，我现在需要运行代码。我所做的是从 SPSS22 运行以下代码。

    begin program.
    import spss,spssaux,imp
    abcvalid = imp.load_source('abcvalid', "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py") 
    import abcvalid
    abcvalid.fullprocess("9_26_2016","M:/Users/Yli\2016 SURVEY/DOWNLOADS/9_26_2016/","M:/Users/Yli/2016 SURVEY/Legacy15.sav")
    end program.

Run Code Online (Sandbox Code Playgroud)

然后我从输出中得到了以下内容。

    Traceback (most recent call last):
      File "<string>", line 5, in <module>
      File "I:/VALIDITY CHECK/Python Library/2016/abcnvalid2016.py", line 2067, in fullprocess
        dataprep(date,filepath,legacypath)
      File "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py", line 2006, in dataprep
        emailslower(date,filepath)
      File "I:/VALIDITY CHECK/Python Library/2016/abcvalid2016.py", line 1635, in emailslower
        DATASET ACTIVATE comment_data.""".format(date,filepath))
      File "C:\PROGRA~1\IBM\SPSS\STATIS~1\22\Python\Lib\site-packages\spss\spss.py", line 1494, in Submit
        cmdList = spssutil.CheckStr(cmdList)
      File "C:\PROGRA~1\IBM\SPSS\STATIS~1\22\Python\Lib\site-packages\spss\spssutil.py", line 166, in CheckStr
        s1 = unicode(mystr,locale.getlocale(locale.LC_CTYPE)[1])
      File "C:\Program Files\IBM\SPSS\Statistics\22\Python\lib\encodings\cp1252.py", line 15, in decode
        return codecs.charmap_decode(input,errors,decoding_table)
    UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 55: character maps to <undefined>

Run Code Online (Sandbox Code Playgroud)

我知道这个网站上有类似的问题，但问题和答案对我来说太难理解了。如果有人可以帮助我，我将不胜感激！

先感谢您！

Answer 1

小智 14

对于具有相同错误消息的类似问题，我做了类似的事情，它对我很有用。

with open(workfile, 'r', encoding='utf-8') as f:
    read_data = f.read()
f.close()

Run Code Online (Sandbox Code Playgroud)

这里需要`f.close()`吗？不是包含在with语句里吗 (5认同)

Answer 2

ber*_*ers 6

首先，这是在 Windows 上重现错误的最小示例：

import subprocess

with subprocess.Popen("cmd /c echo ü", stdout=subprocess.PIPE, text=True) as Process:
    for Line in Process.stdout:
        print(Line)

Run Code Online (Sandbox Code Playgroud)

据我了解，问题是这样的（我整理了一些我发现的信息和示例，但不确定一切是否正确。我欢迎更正。）

该ü字符是 Unicode 中的代码点 252 = 0xfc，https: //unicode-table.com/en/00FC/ ）。
Python 正确地将ü字符传递到控制台，因为您可以使用此示例进行测试（确保将文件保存为 UTF-8）：

import subprocess

print(ord('ü'))
subprocess.call("cmd /c echo ü")

Run Code Online (Sandbox Code Playgroud)

我不确定为什么这首先起作用。（这个答案可能是为什么：https : //stackoverflow.com/a/32176732/880783）

控制台在内部使用 Unicode 以外的东西。例如，在ASCII 表中，ü字符位于位置 129 = 0x81（听起来很熟悉？）。
因此，当控制台返回该字符时，Python 认为它是一个 Unicode 代码点，但0x81 未定义。因此错误。

关键是让 Python 了解它从过程中获得的信息是如何编码的。在我的示例（Windows 控制台）中，我尝试了几种编码（请参阅此处的列表），如下所示：

import subprocess

Encoding = 'cp850'
with subprocess.Popen("cmd /c echo ü", stdout=subprocess.PIPE, text=True, encoding=Encoding) as Process:
    for Line in Process.stdout:
        print(Line)

Run Code Online (Sandbox Code Playgroud)

'ascii'失败并出现ordinal not in range(128)错误（可能不包括扩展 ASCII）。
'cp1252' 失败 character maps to <undefined>
'latin_1' 工作，但在 VS Code 的调试控制台上输出一个框字符 (``)。
'cp850'似乎工作，输出一个ü字符。

所以我'cp850'现在会坚持下去，看看情况如何。

Answer 3

小智 2

很难确定这里发生了什么，因为后台有很多代码，但错误消息告诉您输入流中存在无效字符。代码 x81 在代码页 1252 中未定义，该代码页是有效的代码页。这是西欧/美国的默认代码页。该程序正在尝试将假定的代码页字符串转换为 Unicode，因此失败。

我的猜测是，输入实际上没有使用 cp 1252 进行编码。统计信息当前代码页或 Unicode 模式中出现了一些混乱。您可能需要将 SPSS Statistics 区域设置设置为不同的内容，或者打开或关闭 Unicode 模式。有关如何执行此操作的信息，请参阅命令语法参考中的 SET LOCALE 和 SET UNICODE。

如果您可以详细说明您的区域设置以及此代码的用途，我们也许能够提供更多信息。

归档时间：	9 年，3 月前
查看次数：	16477 次
最近记录：	5 年，1 月前

UnicodeDecodeError: 'charmap' 编解码器无法解码位置 55 中的字节 0x81：字符映射到 &lt;undefined&gt;

UnicodeDecodeError: 'charmap' 编解码器无法解码位置 55 中的字节 0x81：字符映射到 <undefined>