我正在尝试用NaN值替换数据中的一些空列表.但是如何在表达式中表示一个空列表?
import numpy as np
import pandas as pd
d = pd.DataFrame({'x' : [[1,2,3], [1,2], ["text"], []], 'y' : [1,2,3,4]})
d
x y
0 [1, 2, 3] 1
1 [1, 2] 2
2 [text] 3
3 [] 4
d.loc[d['x'] == [],['x']] = d.loc[d['x'] == [],'x'].apply(lambda x: np.nan)
d
ValueError: Arrays were different lengths: 4 vs 0
Run Code Online (Sandbox Code Playgroud)
而且,我想选择[text]使用d[d['x'] == ["text"]]带有ValueError: Arrays were different lengths: 4 vs 1错误,但选择3使用d[d['y'] == 3]是正确的.为什么?
Abd*_*dou 13
如果您希望x用numpy 替换列中的空列表nan,可以执行以下操作:
d.x = d.x.apply(lambda y: np.nan if len(y)==0 else y)
Run Code Online (Sandbox Code Playgroud)
如果要在等于的行上对数据帧进行子集化['text'],请尝试以下操作:
d[[y==['text'] for y in d.x]]
Run Code Online (Sandbox Code Playgroud)
我希望这有帮助.
| 归档时间: |
|
| 查看次数: |
5488 次 |
| 最近记录: |