BSON 文件转 pandas 数据框

Han*_*Yun 3 bson

我正在寻找涉及 venmo 数据集的项目。我能够下载 bson 文件,它位于我的桌面上,但我不知道如何处理它。我不太熟悉 MongoDB,我希望将其转换为 pandas 数据框进行分析。有人知道这样做有什么建议吗?

小智 6

下面是一个如何读取 bson 文件的 Python 示例:

import pandas as pd
import bson

FILE="/folder/file.bson"

with open(FILE,'rb') as f:
    data = bson.decode_all(f.read())

main_df=pd.DataFrame(data)
main_df.describe()
Run Code Online (Sandbox Code Playgroud)

  • 当您使用“pip install pymongo”的“import bson”时,这是有效的,请注意,它不能与“pip install bson”的“import bson”一起使用。如果您碰巧同时安装了两者,则 `pip install pymongo` 的 `import bson` 会主导 `pip install bson`,但无论如何您也可以使用 `pip uninstall bson`。如果您需要这两个包,请使用“pip install pybson”,然后使用“from pybson import bson as ...”,替代名称根据 https://github.com/py-bson/bson/issues/70 (3认同)