Ski*_*tch 2 python mask data-analysis dataframe pandas
这是我的代码,无论我做什么,我都会不断收到错误并遵循所有与索引相关的解决方案,有人可以帮助我吗?
site = pd.read_csv('../data/survey_site.csv')
sampled = site.sample(n=1)
site = site.reset_index(drop=True)
sampled = sampled.reset_index(drop=True)
mask = site.mask(site['name'] == sampled['name'])
Run Code Online (Sandbox Code Playgroud)
问题是之间的比较site['name'],并sample['name']为两者之间pd.Series。您可以通过将其中一个设为标量来绕过它。但是,我注意到您使用了 asample长度1。我怀疑你认为当你接受sample['name']它时它会是一个标量值。但它是一个长度的系列。所以你只需要 make 是一个标量。
选项1
mask = site.mask(site['name'] == sampled['name'].squeeze())
Run Code Online (Sandbox Code Playgroud)
选项 2
mask = site.mask(site['name'] == sampled.loc[0, 'name'])
Run Code Online (Sandbox Code Playgroud)