我很难将多行分隔的 JSON 文件加载到单个 Pandas 数据帧中。这是我正在使用的代码:
import os, json
import pandas as pd
import numpy as np
import glob
pd.set_option('display.max_columns', None)
temp = pd.DataFrame()
path_to_json = '/Users/XXX/Desktop/Facebook Data/*'
json_pattern = os.path.join(path_to_json,'*.json')
file_list = glob.glob(json_pattern)
for file in file_list:
data = pd.read_json(file, lines=True)
temp.append(data, ignore_index = True)
Run Code Online (Sandbox Code Playgroud)
当我查看时,似乎所有文件都在加载file_list,但无法弄清楚如何将每个文件放入数据帧中。大约有 50 个文件,每个文件中有几行。
我正在使用Pandas 数据框中df.isnull().sum()的NaN值计数。
有没有办法只显示不为零的值计数(即,如果该列有 0 个 NaN,则不显示在值计数中。
这是结果,我想删除 0 值
Job ID 0
Agency 0
Posting Type 0
# Of Positions 0
Business Title 0
Civil Service Title 0
Title Code No 0
Level 0
Job Category 2
Full-Time/Part-Time indicator 261
Salary Range From 0
Salary Range To 0
Salary Frequency 0
Work Location 0
Division/Work Unit 0
Job Description 0
Minimum Qual Requirements 14
Preferred Skills 377
Additional Information 1177
To Apply 1
Hours/Shift 2123
Work …Run Code Online (Sandbox Code Playgroud)