小编MEh*_*san的帖子

如何使用Pandas将增量数字添加到新列

我有这个简化的数据帧:

ID   Fruit
F1   Apple
F2   Orange
F3   Banana 
Run Code Online (Sandbox Code Playgroud)

我想在数据帧的开头添加一个新列df['New_ID'] ,其列数880在每行中递增1.

输出应该简单如下:

New_ID   ID   Fruit
880      F1   Apple
881      F2   Orange
882      F3   Banana  
Run Code Online (Sandbox Code Playgroud)

我尝试了以下方法:

df['New_ID'] = ["880"] # but I want to do this without assigning it the list of numbers literally
Run Code Online (Sandbox Code Playgroud)

不知道怎么解决这个问题?

谢谢!

python dataframe pandas

45
推荐指数
5
解决办法
7万
查看次数

在Pandas中使用.notnull()时的正确语法是什么?

我想.notnull()在数据帧的几个列上使用,以消除包含"NaN"值的行.

假设我有以下内容df:

  A   B   C
0 1   1   1
1 1   NaN 1
2 1   NaN NaN
3 NaN 1   1
Run Code Online (Sandbox Code Playgroud)

我试着使用这种语法,但它不起作用?你知道我做错了吗?

df[[df.A.notnull()],[df.B.notnull()],[df.C.notnull()]]
Run Code Online (Sandbox Code Playgroud)

我收到此错误:

TypeError: 'Series' objects are mutable, thus they cannot be hashed
Run Code Online (Sandbox Code Playgroud)

我该怎么做以获得以下输出?

  A   B   C
0 1   1   1
Run Code Online (Sandbox Code Playgroud)

任何的想法?

python null dataframe pandas

11
推荐指数
1
解决办法
1万
查看次数

如何删除Dataframe列中的字符串子串?

我有这个简化的数据帧:

ID, Date
1 8/24/1995
2 8/1/1899 :00
Run Code Online (Sandbox Code Playgroud)

如何使用pandas的功能来识别数据框中有额外的日期:00并删除它.

知道如何解决这个问题吗?

我尝试过这种语法,但没有帮助:

df[df["Date"].str.replace(to_replace="\s:00", value="")]
Run Code Online (Sandbox Code Playgroud)

输出应该是:

ID, Date
1 8/24/1995
2 8/1/1899
Run Code Online (Sandbox Code Playgroud)

python regex string dataframe pandas

9
推荐指数
2
解决办法
8419
查看次数

如何使用Python按各种符号分割?

我有这个简单的文件:

1|2|234 A=Jim 33
1|2|765 A=Sam 44
1|2|561 A=Edy 55
Run Code Online (Sandbox Code Playgroud)

我想解析该文件以获得以下输出:

["1","2","Jim 33"]
["1","2","Sam 44"]
["1","2","Edy 55"]
Run Code Online (Sandbox Code Playgroud)

我尝试用“|”分割,但我面临的问题是如何用“A=”分割或如何使程序识别“A=”并打印它后面的内容。

我想到的算法是迭代每个拆分项并检查该项是否包含字符“A=”。不知道如何将其转换为 python 代码。有什么蟒蛇式的想法吗?

python string parsing split

5
推荐指数
1
解决办法
3500
查看次数

如何通过Pandas中的降序对两列进行排序?

我有这个数据帧df由两列的IDDate:

ID    Date
4    1/1/2008
3    1/1/2007
2   9/23/2010
2    6/3/1998
2    1/1/2001 # Note this date should be before "6/3/1998" for ID# 2
1   4/30/2003
Run Code Online (Sandbox Code Playgroud)

我要排序dfIDDate降序排列(最大- >最小的),但是当我尝试下面的脚本这似乎不工作:

print df.sort_values(by=["ID", "Date"], ascending=["False", "False"])
Run Code Online (Sandbox Code Playgroud)

输出应按此降序排列:

ID    Date
4    1/1/2008
3    1/1/2007
2   9/23/2010
2    1/1/2001 
2    6/3/1998
1   4/30/2003
Run Code Online (Sandbox Code Playgroud)

知道如何按正确的降序对日期进行排序?

python sorting dataframe pandas

2
推荐指数
1
解决办法
3526
查看次数

如何在Pandas中格式化日期列?

我有一个如下所示的数据框df:

   ID Date
0  1  2008-01-24 
1  2  2007-02-17
Run Code Online (Sandbox Code Playgroud)

格式Date%Y-%m-%d

如何格式化日期%m-%d-%Y格式?

我尝试使用这种语法,但它没有给出正确的格式:

df["Date"] = df["Date"].strftime("%m-%d-%Y")
Run Code Online (Sandbox Code Playgroud)

不知道怎么解决这个问题?

python format datetime dataframe pandas

2
推荐指数
2
解决办法
6860
查看次数

如何用我的DataFrame中的空字符串替换所有“ nan”字符串?

"None""nan"字符串散落在我的数据帧。有没有一种方法可以将所有这些替换为空字符串,""否则nan在将数据框导出为Excel工作表时它们不会显示出来?

简化示例:

注意: nan in col4中不是字符串

ID  col1   col2   col3   col4
1   Apple  nan    nan    nan
2   None   orange None   nan
3   None   nan    banana nan
Run Code Online (Sandbox Code Playgroud)

当我们将所有"None"and "nan"字符串替换为空字符串后,输出应如下所示""

ID  col1   col2   col3   col4
1   Apple                nan
2          orange        nan
3                 banana nan
Run Code Online (Sandbox Code Playgroud)

任何想法如何解决这个问题?

谢谢,

python string nan dataframe pandas

2
推荐指数
2
解决办法
9576
查看次数

如何根据"水果"栏中的多个值删除所有行?

我有这个简单的数据帧

Num   Fruit   Price
1     Apple   1.00
1     Apple   1.00
2     Apple   1.50
2     Orange  1.50
3     Orange  1.00
3     Banana  0.50
Run Code Online (Sandbox Code Playgroud)

我想删除所有这些都是水果中的行AppleOrange

预期的输出应该是这样的:

Num  Fruit   Price
3    Banana  0.50
Run Code Online (Sandbox Code Playgroud)

我尝试使用以下语法,但不知何故它没有删除数据帧中的所有行

>>> df.drop(df.Fruit.isin(["Apple","Orange"]))
Fruit Num Price
2   Apple   2  1.50
3  Orange   2  1.50
4  Orange   3  1.00
5  Banana   3  0.50
Run Code Online (Sandbox Code Playgroud)

有什么建议如何解决这个问题?

python dataframe pandas

0
推荐指数
1
解决办法
1159
查看次数

标签 统计

python ×8

dataframe ×7

pandas ×7

string ×3

datetime ×1

format ×1

nan ×1

null ×1

parsing ×1

regex ×1

sorting ×1

split ×1