小编War*_*ega的帖子

我试图将.txt文件的一部分从行号n复制到行号n + y(假设1000到1000000).

我试过运营商和sed,但它失败了.这是我试过的命令:

sed -n "1000, 1000000p" path/first/file > path/second/file

11
推荐指数

1
解决办法

2万
查看次数

几天后我遇到了python问题.我是一名没有基本编程技能的生物信息学,我正在处理我必须处理的大文本文件(约25gb).

我必须逐行读取txt文件,每组4行,这意味着必须读取和处理前4行,然后我必须读取第2组4行,依此类推.

显然我不能使用readlines()运算符,因为它会使我的内存过载,我必须使用4行中的每一行进行一些字符串识别.

我考虑过使用带有范围运算符的for循环:

openfile = open(path, 'r')

for elem in range(0, len(openfile), 4):

line1 = readline()
line2 = readline()
line3 = readline()
line4 = readline()
(process lines...)

不幸的是,这是不可能的,因为处于"读取"模式的文件不能被迭代并被视为列表或字典.

任何人都可以帮忙正确地循环吗？

提前致谢

3
推荐指数

1
解决办法

4070
查看次数

小编War_ega的帖子