小编blu*_*hip的帖子

使用Pandas和PyMongo将MongoDB数据加载到DataFrame的更好方法?

我有一个0.7 GB的MongoDB数据库,其中包含我正在尝试加载到数据帧中的推文.但是,我收到一个错误.

MemoryError:    
Run Code Online (Sandbox Code Playgroud)

我的代码看起来像这样:

cursor = tweets.find() #Where tweets is my collection
tweet_fields = ['id']
result = DataFrame(list(cursor), columns = tweet_fields)
Run Code Online (Sandbox Code Playgroud)

我已经尝试了以下答案中的方法,在某些时候,在加载之前创建数据库的所有元素的列表.

然而,在另一个讨论list()的答案中,该人说它对小数据集有好处,因为所有内容都被加载到内存中.

就我而言,我认为这是错误的根源.这是太多的数据加载到内存中.我还可以使用其他什么方法?

python pymongo pandas

8
推荐指数
2
解决办法
1万
查看次数

标签 统计

pandas ×1

pymongo ×1

python ×1