小编hda*_*tas的帖子

删除以.开头的列

我有一个包含多列的数据框,例如:

        Prod_A       Prod_B        Prod_C        State         Region
1          1           0             1             1              1
Run Code Online (Sandbox Code Playgroud)

我想删除所有以Prod_开头的列,(我不能选择或按名称删除,因为数据框有200个变量)是否可以这样做?

谢谢

python numpy dataframe pandas

8
推荐指数
3
解决办法
2420
查看次数

根据行索引创建名为“Id”的列

我想为名为“Id”的数据框创建一个新列,其中值是行索引 +1。我想像下面的例子:

   ID  Col1  ...
0  1   a     ...
1  2   b     ...
2  3   c     ...
Run Code Online (Sandbox Code Playgroud)

python pandas

7
推荐指数
1
解决办法
2万
查看次数

2 列 pandas 上的地图

我有一个数据框,如下所示:

        Col1           Col2
0        A              PY
1        B              PA
2        C              PB
3        B              PB
Run Code Online (Sandbox Code Playgroud)

以及这个系列:

                            Value
   Col1       Col2     
    A          PY             20
    B          PB             30
Run Code Online (Sandbox Code Playgroud)

我想做一个映射,如果该系列有一个索引(仅前 Col1),那么它非常简单:

  df['Value'] = df['Col1'].map(s)
Run Code Online (Sandbox Code Playgroud)

如何基于 2 个索引/列进行映射?

谢谢 !

python dictionary numpy dataframe pandas

5
推荐指数
1
解决办法
4900
查看次数

删除超过 70% 零的列

我想知道是否有一个命令可以删除具有超过 70% 零或 X% 零的列。喜欢:

     df = df.loc[:, df.isnull().mean() < .7]
Run Code Online (Sandbox Code Playgroud)

对于 NaN。

谢谢 !

python numpy dataframe pandas

3
推荐指数
1
解决办法
1664
查看次数

方程组求解器 pandas

我有这个数据框作为例子:

       Col1         Col2     ...    Col5       Price
 0     Wood         Wood            Plastic     50
 1     Iron         Wood            Wood        70
                            ...
3000   Iron         Iron            Wood        110
Run Code Online (Sandbox Code Playgroud)

我想知道是否可以为 N 个未知数建立一个线性求解器 N 方程(在本例中查找木材、铁、塑料等的价格......)

非常感谢 !

python math numpy scipy pandas

3
推荐指数
1
解决办法
4822
查看次数

删除低频词

我有一个包含2列的数据框,1列包含单词串,例如:

       Col1                 Col2
0       1          how to remove this word
1       5          how to remove the  word
Run Code Online (Sandbox Code Playgroud)

我想删除在整个数据帧中出现一次的所有单词(阈值= 1),我会得到例子:(如果我可以指定阈值,那就更好了)

       Col1                 Col2
0       1          how to remove word
1       5          how to remove word
Run Code Online (Sandbox Code Playgroud)

有什么建议 ?谢谢 !

python text replace dataframe pandas

2
推荐指数
1
解决办法
804
查看次数

价值指数

我有一个数据帧如下:

      Col1
0      A
1      B
3      D
4      A
5      A
Run Code Online (Sandbox Code Playgroud)

我想创建一个列来计算相同值的2个出现之间的索引差异.我会得到:

      Col1      Col2
0      A         0
1      B         0
3      D         0
4      A         4
5      A         1
Run Code Online (Sandbox Code Playgroud)

对于我想要做的每个值,在这个例子中,B和D发生一次.

有什么建议 ?谢谢 !

dataframe

0
推荐指数
1
解决办法
36
查看次数

标签 统计

pandas ×6

python ×6

dataframe ×5

numpy ×4

dictionary ×1

math ×1

replace ×1

scipy ×1

text ×1