我有这个简化的数据帧:
ID Fruit
F1 Apple
F2 Orange
F3 Banana
Run Code Online (Sandbox Code Playgroud)
我想在数据帧的开头添加一个新列df['New_ID'] ,其列数880在每行中递增1.
输出应该简单如下:
New_ID ID Fruit
880 F1 Apple
881 F2 Orange
882 F3 Banana
Run Code Online (Sandbox Code Playgroud)
我尝试了以下方法:
df['New_ID'] = ["880"] # but I want to do this without assigning it the list of numbers literally
Run Code Online (Sandbox Code Playgroud)
不知道怎么解决这个问题?
谢谢!
我想.notnull()在数据帧的几个列上使用,以消除包含"NaN"值的行.
假设我有以下内容df:
A B C
0 1 1 1
1 1 NaN 1
2 1 NaN NaN
3 NaN 1 1
Run Code Online (Sandbox Code Playgroud)
我试着使用这种语法,但它不起作用?你知道我做错了吗?
df[[df.A.notnull()],[df.B.notnull()],[df.C.notnull()]]
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
TypeError: 'Series' objects are mutable, thus they cannot be hashed
Run Code Online (Sandbox Code Playgroud)
我该怎么做以获得以下输出?
A B C
0 1 1 1
Run Code Online (Sandbox Code Playgroud)
任何的想法?
我有这个简化的数据帧:
ID, Date
1 8/24/1995
2 8/1/1899 :00
Run Code Online (Sandbox Code Playgroud)
如何使用pandas的功能来识别数据框中有额外的日期:00并删除它.
知道如何解决这个问题吗?
我尝试过这种语法,但没有帮助:
df[df["Date"].str.replace(to_replace="\s:00", value="")]
Run Code Online (Sandbox Code Playgroud)
输出应该是:
ID, Date
1 8/24/1995
2 8/1/1899
Run Code Online (Sandbox Code Playgroud) 我有这个简单的文件:
1|2|234 A=Jim 33
1|2|765 A=Sam 44
1|2|561 A=Edy 55
Run Code Online (Sandbox Code Playgroud)
我想解析该文件以获得以下输出:
["1","2","Jim 33"]
["1","2","Sam 44"]
["1","2","Edy 55"]
Run Code Online (Sandbox Code Playgroud)
我尝试用“|”分割,但我面临的问题是如何用“A=”分割或如何使程序识别“A=”并打印它后面的内容。
我想到的算法是迭代每个拆分项并检查该项是否包含字符“A=”。不知道如何将其转换为 python 代码。有什么蟒蛇式的想法吗?
我有这个数据帧df由两列的ID和Date:
ID Date
4 1/1/2008
3 1/1/2007
2 9/23/2010
2 6/3/1998
2 1/1/2001 # Note this date should be before "6/3/1998" for ID# 2
1 4/30/2003
Run Code Online (Sandbox Code Playgroud)
我要排序df的ID和Date降序排列(最大- >最小的),但是当我尝试下面的脚本这似乎不工作:
print df.sort_values(by=["ID", "Date"], ascending=["False", "False"])
Run Code Online (Sandbox Code Playgroud)
输出应按此降序排列:
ID Date
4 1/1/2008
3 1/1/2007
2 9/23/2010
2 1/1/2001
2 6/3/1998
1 4/30/2003
Run Code Online (Sandbox Code Playgroud)
知道如何按正确的降序对日期进行排序?
我有一个如下所示的数据框df:
ID Date
0 1 2008-01-24
1 2 2007-02-17
Run Code Online (Sandbox Code Playgroud)
格式Date是%Y-%m-%d
如何格式化日期%m-%d-%Y格式?
我尝试使用这种语法,但它没有给出正确的格式:
df["Date"] = df["Date"].strftime("%m-%d-%Y")
Run Code Online (Sandbox Code Playgroud)
不知道怎么解决这个问题?
我"None"和"nan"字符串散落在我的数据帧。有没有一种方法可以将所有这些替换为空字符串,""否则nan在将数据框导出为Excel工作表时它们不会显示出来?
简化示例:
注意: nan in col4中不是字符串
ID col1 col2 col3 col4
1 Apple nan nan nan
2 None orange None nan
3 None nan banana nan
Run Code Online (Sandbox Code Playgroud)
当我们将所有"None"and "nan"字符串替换为空字符串后,输出应如下所示"":
ID col1 col2 col3 col4
1 Apple nan
2 orange nan
3 banana nan
Run Code Online (Sandbox Code Playgroud)
任何想法如何解决这个问题?
谢谢,
我有这个简单的数据帧
Num Fruit Price
1 Apple 1.00
1 Apple 1.00
2 Apple 1.50
2 Orange 1.50
3 Orange 1.00
3 Banana 0.50
Run Code Online (Sandbox Code Playgroud)
我想删除所有这些都是水果中的行Apple或Orange
预期的输出应该是这样的:
Num Fruit Price
3 Banana 0.50
Run Code Online (Sandbox Code Playgroud)
我尝试使用以下语法,但不知何故它没有删除数据帧中的所有行
>>> df.drop(df.Fruit.isin(["Apple","Orange"]))
Fruit Num Price
2 Apple 2 1.50
3 Orange 2 1.50
4 Orange 3 1.00
5 Banana 3 0.50
Run Code Online (Sandbox Code Playgroud)
有什么建议如何解决这个问题?