小编too*_*oop的帖子

unix - 按行拆分一个巨大的 .gz 文件

我确定有人有以下需求,按行拆分巨大的 .gz 文件的快速方法是什么?底层文本文件有 1.2 亿行。我没有足够的磁盘空间来一次对整个文件进行压缩,所以我想知道是否有人知道可以将文件(.gz 或内部 .txt)拆分为 3x 40mn 行文件的 bash/perl 脚本或工具. 即调用它像:

    bash splitter.sh hugefile.txt.gz 4000000 1
 would get lines 1 to 40 mn    
    bash splitter.sh hugefile.txt.gz 4000000 2
would get lines 40mn to 80 mn
    bash splitter.sh hugefile.txt.gz 4000000 3
would get lines 80mn to 120 mn
Run Code Online (Sandbox Code Playgroud)

也许是在做一系列这些解决方案,或者 gunzip -c 需要足够的空间来解压缩整个文件(即原始问题): gunzip -c hugefile.txt.gz | 头 4000000

注意:我无法获得额外的磁盘。

谢谢!

linux unix bash shell perl

18
推荐指数
3
解决办法
2万
查看次数

excel vba - 多行正则表达式不起作用

在 Excel 工作表的单元格 A1 中,单元格内有以下内容:

select a.id, b.type, c.name 
from blah a, 
blah2 b, 
blah3 c
where a.id = b.key
and b.key = c.id
;
Run Code Online (Sandbox Code Playgroud)

以下任一结果都是期望的结果:

select 1 from
blah a, 
blah2 b, 
blah3 c
where a.id = b.key
and b.key = c.id
;
Run Code Online (Sandbox Code Playgroud)

或者

select 1
from blah a, 
blah2 b, 
blah3 c
where a.id = b.key
and b.key = c.id
;
Run Code Online (Sandbox Code Playgroud)

我有这个vba代码

    Dim objRegExp As New RegExp
    objRegExp.Pattern = "select .+ from"
    objRegExp.Global = True
    objRegExp.MultiLine = True …
Run Code Online (Sandbox Code Playgroud)

regex vba macros microsoft-excel

2
推荐指数
1
解决办法
6636
查看次数

标签 统计

bash ×1

linux ×1

macros ×1

microsoft-excel ×1

perl ×1

regex ×1

shell ×1

unix ×1

vba ×1