Python 3 Base64 解码弄乱换行符

Question

Python 3 Base64 解码弄乱换行符

我试图通过标准 python 库解码 base64 多行文件，但是只有第一行被解码，其余的被无缘无故地转储。

为什么是这样？

编码之前的文件（解码后我试图实现的目标）：

数据文件.dat

版本：BenWin+ 版本：3.0.12.1[CR]

[CR][LF]

创建时间：2016 年 9 月 1 日 12:56:27 PM[CR]

[CR][LF]

时间代码：0x907e0、0x10004、0x38000c、0x242001b[CR]

[CR][LF]

...

[CR]和[LF]分别是回车符(\r)和换行符(\n)的字符代码

我使用 base64.b64encode 对文件进行 Base64 编码，并希望稍后对其进行解码。这是我的代码片段。

encodedData = b'VkVSU0lPTjogQmVuV2luKyBWZXJzaW9uOiAzLjAuMTIuMQo=Cg==Q1JFQVRFRDogMDEgU2VwdGVtYmVyIDIwMTYgMTI6NTY6MjcgUE0KCg==VElNRSBDT0RFOiAweDkwN2UwLCAweDEwMDA0LCAweDM4MDAwYywgMHgyNDIwMDFiCg==Cg=='

data = base64.b64decode(encodedData)
print(data)

Run Code Online (Sandbox Code Playgroud)

哪个返回

b'版本：BenWin+ 版本：3.0.12.1\n'

提前致谢。使用Python 3.5

Answer 1

PM *_*ing 5

问题似乎是您分别对每一行进行编码，然后将这些编码的字符串连接在一起。Base-64 编码的字符串可能以填充字符结尾，当解码器看到这些填充字符时，它会假定这是有效数据的结尾，因此将忽略任何后续数据。

下面介绍如何在 Python 3 中对多行文本进行 Base64 编码。首先，我们需要将 Unicode 文本转换为字节。然后我们一次性对所有这些字节进行 Base64 编码。为了解码，我们反转该过程：首先进行 Base64 解码，然后将结果字节解码为 Unicode 字符串。请注意，\r和\n已正确保存。

import base64

s = 'VERSION: BenWin+ Version: 3.0.12.1\r\r\nCREATED: 01 September 2016 12:56:27 PM\r\r\nTIME CODE: 0x907e0, 0x10004, 0x38000c, 0x242001b\r\r\n'
print(s)

b = base64.b64encode(s.encode('utf8'))
print(b)

z = base64.b64decode(b).decode('utf8')
print(repr(z))

Run Code Online (Sandbox Code Playgroud)

输出

VERSION: BenWin+ Version: 3.0.12.1
CREATED: 01 September 2016 12:56:27 PM
TIME CODE: 0x907e0, 0x10004, 0x38000c, 0x242001b

b'VkVSU0lPTjogQmVuV2luKyBWZXJzaW9uOiAzLjAuMTIuMQ0NCkNSRUFURUQ6IDAxIFNlcHRlbWJlciAyMDE2IDEyOjU2OjI3IFBNDQ0KVElNRSBDT0RFOiAweDkwN2UwLCAweDEwMDA0LCAweDM4MDAwYywgMHgyNDIwMDFiDQ0K'
'VERSION: BenWin+ Version: 3.0.12.1\r\r\nCREATED: 01 September 2016 12:56:27 PM\r\r\nTIME CODE: 0x907e0, 0x10004, 0x38000c, 0x242001b\r\r\n'

Run Code Online (Sandbox Code Playgroud)

归档时间：	9 年，4 月前
查看次数：	8780 次
最近记录：	9 年，4 月前