Python - 从文件到数据结构?

Dar*_*ick 2 python string

我有大文件包含~100,000行.每行对应于一个簇,每一行中的每个条目是另一个文件的参考id(在这种情况下是蛋白质结构),例如

1hgn 1dju 3nmj 8kfn
9opu 7gfb 
4bui
Run Code Online (Sandbox Code Playgroud)

我需要在文件中读取每个行是子列表的列表列表,从而保持集群的完整性,例如

nested_list = [['1hgn', '1dju', '3nmj', '8kfn'], ['9opu', '7gfb'], ['4bui']]
Run Code Online (Sandbox Code Playgroud)

我当前的代码创建了一个嵌套列表,但每个列表中的条目都是单个字符串,而不是逗号分隔.因此,我不能轻易地将索引与索引拼接在一起.

任何帮助非常感谢.

谢谢,S :-)

Oli*_*Oli 13

超级简单:

with open('myfile', 'r') as f:
    data = [line.split() for line in f]
Run Code Online (Sandbox Code Playgroud)

  • 不 - 这将完全符合OP的要求.Yay Python和电池包括在内. (2认同)

Pet*_*ley 6

您需要调查该str.split()方法.

>>> '1hgn 1dju 3nmj 8kfn'.split()
['1hgn', '1dju', '3nmj', '8kfn']
Run Code Online (Sandbox Code Playgroud)