如何在python中将字符串转换为int?
这样说: 'y\xcc\xa6\xbb'
我想出了一个聪明/愚蠢的方法:
sum(ord(c) << (i * 8) for i, c in enumerate('y\xcc\xa6\xbb'[::-1]))
Run Code Online (Sandbox Code Playgroud)
我知道必须有内置或标准库中的内容,这样做更简单...
这与转换可以使用int(xxx,16)的十六进制数字字符串不同,而是我想转换一串实际字节值.
更新:
我有点像詹姆斯的答案好一点,因为它不需要导入另一个模块,但Greg的方法更快:
>>> from timeit import Timer
>>> Timer('struct.unpack("<L", "y\xcc\xa6\xbb")[0]', 'import struct').timeit()
0.36242198944091797
>>> Timer("int('y\xcc\xa6\xbb'.encode('hex'), 16)").timeit()
1.1432669162750244
Run Code Online (Sandbox Code Playgroud)
我的hacky方法:
>>> Timer("sum(ord(c) << (i * 8) for i, c in enumerate('y\xcc\xa6\xbb'[::-1]))").timeit()
2.8819329738616943
Run Code Online (Sandbox Code Playgroud)
进一步更新:
有人在评论中询问导入另一个模块的问题是什么.好吧,导入模块不一定便宜,看看:
>>> Timer("""import struct\nstruct.unpack(">L", "y\xcc\xa6\xbb")[0]""").timeit()
0.98822188377380371
Run Code Online (Sandbox Code Playgroud)
包括导入模块的成本几乎抵消了该方法的所有优点.我相信这只会包括在整个基准测试中导入一次的费用; 看看我每次强迫它重装时会发生什么:
>>> Timer("""reload(struct)\nstruct.unpack(">L", "y\xcc\xa6\xbb")[0]""", 'import struct').timeit()
68.474128007888794
Run Code Online (Sandbox Code Playgroud)
毋庸置疑,如果你在每次导入时执行大量的这种方法,那么这个问题就会成比例地减少.它也可能是i/o成本而不是cpu,因此它可能取决于特定机器的容量和负载特性.
我在尝试解压缩zip文件时遇到了这个问题.
- zipfile.is_zipfile(my_file)总是返回False,即使UNIX命令解压缩处理它也没问题.此外,在尝试时,zipfile.ZipFile(path/file_handle_to_path)我得到相同的错误
- 该file命令返回Zip archive data, at least v2.0 to extract并使用less它显示的文件:
PKZIP for iSeries by PKWARE
Length Method Size Cmpr Date Time CRC-32 Name
2113482674 Defl:S 204502989 90% 2010-11-01 08:39 2cee662e myfile.txt
2113482674 204502989 90% 1 file
任何想法如何解决这个问题?如果我可以进行python的zipfile工作会很好,因为我已经有一些单元测试,如果我将切换到运行,我将不得不放弃subprocess.call("unzip")