标签: bzip2

利用多核进行tar + gzip/bzip压缩/解压缩

我通常压缩使用tar zcvf和解压缩使用tar zxvf(由于习惯使用gzip).

我最近得到了一个具有超线程的四核CPU,所以我有8个逻辑核心,我注意到许多核心在压缩/解压缩期间未被使用.

有什么办法可以利用未使用的核心来加快速度吗?

gzip 7zip tar xz bzip2

198
推荐指数
4
解决办法
14万
查看次数

缺少python bz2模块

我已经安装在我的主目录中.

[spatel@~ dev1]$ /home/spatel/python-2.7.3/bin/python -V
Python 2.7.3
Run Code Online (Sandbox Code Playgroud)

我试图运行一个需要python 2.7.x版本的脚本,我错过了bz2错误

[spatel@~ dev1]$ ./import_logs.py
Traceback (most recent call last):
  File "./import_logs.py", line 13, in <module>
    import bz2
ImportError: No module named bz2
Run Code Online (Sandbox Code Playgroud)

我试图安装bz2模块,但我有很多错误

 [spatel@dev1 python-bz2-1.1]$ /home/spatel/python-2.7.3/bin/python setup.py install
    ...
    ...
    ...
    bz2.c:1765: error: âBZ_FINISH_OKâ undeclared (first use in this function)
    bz2.c:1765: warning: comparison between pointer and integer
    bz2.c:1771: error: âPyMemberDefâ has no member named âavail_outâ
    bz2.c:1778: error: âPyMemberDefâ has no member named ânext_outâ
    bz2.c:1778: error: âPyMemberDefâ has no member named âtotal_out_hi32â
    bz2.c:1778: …
Run Code Online (Sandbox Code Playgroud)

python linux bzip2

34
推荐指数
8
解决办法
6万
查看次数

在R中提取bz2文件

我有一堆.csv.bz2文件,我必须在R中下载,提取和读取.我下载了文件并希望将其解压缩到当前工作目录,然后阅读它. unz(filename,filename.csv)但它似乎没有用.我怎样才能做到这一点?

我听说某个地方可以直接读取bzfiles而不解压缩.我怎样才能做到这一点?

r bzip2

32
推荐指数
4
解决办法
3万
查看次数

如何使用awk压缩文件

如何更改压缩文件的以下命令?

awk 'FNR==NR { array[$1,$2]=$8; next } ($1,$2) in array { print $0 ";" array[$1,$2] }' input1.vcf input2.vcf
Run Code Online (Sandbox Code Playgroud)

该命令与普通文件一起正常工作.我需要更改压缩文件的命令.

unix linux shell gzip bzip2

26
推荐指数
3
解决办法
3万
查看次数

Hadoop输入的最佳可拆分压缩= bz2?

我们已经意识到将GZip格式的文件归档用于Hadoop处理并不是一个好主意.GZip不可拆分,以供参考,以下是我不会重复的问题:

我的问题是:BZip2是最好的归档压缩,它允许Hadoop并行处理单个归档文件吗?Gzip肯定不是,从我的阅读LZO有一些问题.

gzip hadoop hdfs bzip2

21
推荐指数
3
解决办法
2万
查看次数

解压缩BZIP2存档

我可以解压缩zip,gzip和rar文件,但我还需要解压缩bzip2文件以及解压缩它们(.tar).我没有遇到过一个好的图书馆.

我正在使用Java和Maven,所以理想情况下,我想将它作为POM中的依赖项包含在内.

你推荐哪些图书馆?

java compression api bzip2

20
推荐指数
1
解决办法
2万
查看次数

20
推荐指数
1
解决办法
1万
查看次数

如何保护自己免受gzip或bzip2炸弹袭击?

这与关于拉链炸弹的问题有关,但考虑到gzip或bzip2压缩,例如接受.tar.gz文件的Web服务.

Python提供了一个方便使用的方便的tarfile模块,但似乎没有提供针对zipbombs的保护.

在使用tarfile模块的python代码中,检测zip炸弹的最优雅方法是什么,最好不要从tarfile模块中复制过多的逻辑(例如透明的解压缩支持)?

而且,只是为了简化它:不涉及真正的文件; 输入是一个类似文件的对象(由Web框架提供,表示用户上传的文件).

python security gzip bzip2

18
推荐指数
3
解决办法
4505
查看次数

Multistream Wikipedia转储

我下载了德语维基百科dump dewiki-20151102-pages-articles-multistream.xml.我的简短问题是:在这种情况下,"多流"意味着什么?

xml wiki wikipedia bzip2 wikimedia-dumps

15
推荐指数
2
解决办法
3083
查看次数

使用bzip提升iostreams - 未解析的符号

我的项目是使用旧版本的Boost的iostreams w/bzip2.我现在正在尝试升级到Boost 1.51.起初我没有用bzip编译,所以很明显我让链接器大喊大叫libboost_bzip2-vc100-mt-sgd-1_51.lib丢失了.然后我按照这些说明(并添加了静态标志)来编译该文件.

但是,运行链接器现在会返回一堆缺少的符号:

>error LNK2001: unresolved external symbol "protected: __thiscall boost::iostreams::detail::bzip2_base::~bzip2_base(void)" (??1bzip2_base@detail@iostreams@boost@@IAE@XZ)
>error LNK2001: unresolved external symbol "protected: __thiscall boost::iostreams::detail::bzip2_base::bzip2_base(struct boost::iostreams::bzip2_params const &)" (??0bzip2_base@detail@iostreams@boost@@IAE@ABUbzip2_params@23@@Z)
>error LNK2001: unresolved external symbol "int const boost::iostreams::bzip2::stream_end" (?stream_end@bzip2@iostreams@boost@@3HB)
...
Run Code Online (Sandbox Code Playgroud)

任何想法如何来lib不包含所有这些代码?我错过了什么?我在Windows上使用VS2010.


编辑:知道了!

有一个没有bzip编译的旧版libboost_iostreams-vc100-mt-sgd-1_51.lib.我仍然不确定的是:我使用的原始编译:

>b2 --with-iostreams -sBZIP2_SOURCE=D:\Work\external\bzip2-1.0.6 -sZLIB_SOURCE=d:\work\external\zlib-1.2.3 runtime-link=static
Run Code Online (Sandbox Code Playgroud)

这产生了以下文件:

libboost_bzip2-vc100-mt-s-1_51.lib
libboost_bzip2-vc100-mt-sgd-1_51.lib
Run Code Online (Sandbox Code Playgroud)

对于"正确的"编译(解决了问题),我使用了:

>b2 --with-iostreams -sBZIP2_SOURCE=D:\Work\external\bzip2-1.0.6 runtime-link=static
Run Code Online (Sandbox Code Playgroud)

即只是删除了zlib,因为它对我来说是不必要的.它产生了:

libboost_bzip2-vc100-mt-s-1_51.lib
libboost_bzip2-vc100-mt-sgd-1_51.lib
libboost_iostreams-vc100-mt-s-1_51.lib
libboost_iostreams-vc100-mt-sgd-1_51.lib
Run Code Online (Sandbox Code Playgroud)

为什么没有在原始编译中生成iostreams库?很奇怪.

谢谢.

c++ boost unresolved-external boost-iostreams bzip2

14
推荐指数
1
解决办法
1708
查看次数