我想读取几个文件 json 文件并将它们写入带有 for 循环的数据帧。
review_categories = ["beauty", "pet"]
for i in review_categories:
filename = "D:\\Library\\reviews_{}.json".format(i)
output = pd.read_json(path_or_buf=filename, lines=True)
return output
Run Code Online (Sandbox Code Playgroud)
问题是我希望每个评论类别都有自己的变量,比如一个名为“beauty_reviews”的数据框,另一个名为“pet_reviews”的数据框,分别包含从 review_beauty.json 和 review_pet.json 读取的数据。
我认为处理字典中的数据框很容易。试试下面的代码:
review_categories = ["beauty", "pet"]
reviews = {}
for review in review_categories:
df_name = review + '_reviews' # the name for the dataframe
filename = "D:\\Library\\reviews_{}.json".format(review)
reviews[df_name] = pd.read_json(path_or_buf=filename, lines=True)
Run Code Online (Sandbox Code Playgroud)
在Reviews 中,您将拥有一个带有相应数据框的键来存储数据。如果要检索数据,只需调用:
reviews["beauty_reviews"]
Run Code Online (Sandbox Code Playgroud)
希望能帮助到你。