The*_*Cat 3 python sqlite dbm large-files
我有一个20 GB的文件,如下所示:
Read name, Start position, Direction, Sequence
Run Code Online (Sandbox Code Playgroud)
请注意,读取名称不一定是唯一的.
例如,我的文件片段看起来像
Read1, 40009348, +, AGTTTTCGTA
Read2, 40009349, -, AGCCCTTCGG
Read1, 50994530, -, AGTTTTCGTA
Run Code Online (Sandbox Code Playgroud)
我希望能够以允许我的方式存储这些行
似乎可以使用数据库.
文档似乎暗示dbm不能用于对文件进行排序并对其进行迭代.
因此,我想知道SQLite3是否能够做1)和2).我知道我将能够使用SQL查询对文件进行排序,并使用sqlite3迭代结果集.但是,如果没有4GB的RAM计算机内存不足,我能够这样做吗?