小编Dav*_* L.的帖子

固定长度数据字段和可变长度utf-8编码

我有一个Python项目,我在一个comm协议中有一个固定的字节长度文本字段(NOT FIXED CHAR-LENGTH FIELD),它包含一个utf-8编码,NULL填充,NULL终止字符串.

我需要确保字符串适合固定的字节长度字段.因为utf-8是一个可变宽度编码,所以这使得使用强力来以固定的字节长度dicey截断字符串,因为你可能会留下一部分多字节字符悬挂在最后.

是否有一个模块/方法/函数/等可以帮助我将utf-8可变宽度编码的字符串截断为固定的字节长度?

做空填充和终止的东西将是一个奖励.

这似乎是一个已经被破解的坚果.如果它已经存在,我不想重新发明一些东西.

python encoding byte utf-8 character-encoding

3
推荐指数
1
解决办法
1430
查看次数

标签 统计

byte ×1

character-encoding ×1

encoding ×1

python ×1

utf-8 ×1