我有一个包含多列的数据框,例如:
Prod_A Prod_B Prod_C State Region
1 1 0 1 1 1
Run Code Online (Sandbox Code Playgroud)
我想删除所有以Prod_开头的列,(我不能选择或按名称删除,因为数据框有200个变量)是否可以这样做?
谢谢
我想为名为“Id”的数据框创建一个新列,其中值是行索引 +1。我想像下面的例子:
ID Col1 ...
0 1 a ...
1 2 b ...
2 3 c ...
Run Code Online (Sandbox Code Playgroud) 我有一个数据框,如下所示:
Col1 Col2
0 A PY
1 B PA
2 C PB
3 B PB
Run Code Online (Sandbox Code Playgroud)
以及这个系列:
Value
Col1 Col2
A PY 20
B PB 30
Run Code Online (Sandbox Code Playgroud)
我想做一个映射,如果该系列有一个索引(仅前 Col1),那么它非常简单:
df['Value'] = df['Col1'].map(s)
Run Code Online (Sandbox Code Playgroud)
如何基于 2 个索引/列进行映射?
谢谢 !
我想知道是否有一个命令可以删除具有超过 70% 零或 X% 零的列。喜欢:
df = df.loc[:, df.isnull().mean() < .7]
Run Code Online (Sandbox Code Playgroud)
对于 NaN。
谢谢 !
我有这个数据框作为例子:
Col1 Col2 ... Col5 Price
0 Wood Wood Plastic 50
1 Iron Wood Wood 70
...
3000 Iron Iron Wood 110
Run Code Online (Sandbox Code Playgroud)
我想知道是否可以为 N 个未知数建立一个线性求解器 N 方程(在本例中查找木材、铁、塑料等的价格......)
非常感谢 !
我有一个包含2列的数据框,1列包含单词串,例如:
Col1 Col2
0 1 how to remove this word
1 5 how to remove the word
Run Code Online (Sandbox Code Playgroud)
我想删除在整个数据帧中出现一次的所有单词(阈值= 1),我会得到例子:(如果我可以指定阈值,那就更好了)
Col1 Col2
0 1 how to remove word
1 5 how to remove word
Run Code Online (Sandbox Code Playgroud)
有什么建议 ?谢谢 !
我有一个数据帧如下:
Col1
0 A
1 B
3 D
4 A
5 A
Run Code Online (Sandbox Code Playgroud)
我想创建一个列来计算相同值的2个出现之间的索引差异.我会得到:
Col1 Col2
0 A 0
1 B 0
3 D 0
4 A 4
5 A 1
Run Code Online (Sandbox Code Playgroud)
对于我想要做的每个值,在这个例子中,B和D发生一次.
有什么建议 ?谢谢 !