我有一大堆字符串,我正在用于自然语言处理研究,我想要一种很好的方式将它存储在Python中.
我可以使用pickle,但是将整个列表加载到内存中将是不可能的(我相信),因为它大约10 GB,并且我没有那么多的主内存.目前我将列表与shelve库一起存储...架子用字符串索引,"0","1",......,"n"这有点笨重.
有没有更好的方法将这样的对象存储在一个文件中,并且仍然可以随机(ish)访问它?
可能最好的选择是将其拆分为多个列表.
谢谢!
看起来您只能从数据 - >排序中选择3个条件.有没有办法(可能是程序化的)使用其他标准?