我正在尝试清理我的数据帧,如果我的"Base_2007"和"Base_2011"列包含NA,那么我应该完全删除该县.在我的情况下,因为两个县都包含NA,所以它们都将被删除.因此将返回空数据集.可以这样做吗?
数据:
State Year Base_2007 Base_2011 County
0 AL 2012 NaN 14.0 Alabama_Country
1 AL 2013 12.0 20.0 Alabama_Country
2 AL 2014 13.0 NaN Alabama_Country
3 DC 2011 NaN 20.0 Trenton
4 DC 2012 19.0 NaN Trenton
5 DC 2013 20.0 21.0 Trenton
6 DC 2014 25.0 30.0 Trenton
Run Code Online (Sandbox Code Playgroud)
数据帧的尾部分:
{'State': {82550: 'WY', 82551: 'WY', 82552: 'WY', 82553: 'WY', 82554: 'WY', 82555: 'WY', 82556: 'WY', 82557: 'WY', 82558: 'WY', 82559: 'WY'}, 'County': {82550: 'Weston', 82551: 'Weston', 82552: 'Weston', 82553: 'Weston', …
Run Code Online (Sandbox Code Playgroud) 所有,
我正在尝试使用subplots函数和Seaborn
库来绘制两个Factorplots 。我可以使用下面的代码分别绘制两个图。但是,seaborn
正在实际图下方生成额外的图(请参见下图)。有没有一种方法可以避免seaborn
生成多余的空图?我试图plt.close
摆脱地块,但不幸的是,它只是关闭了1个地块。此外,我试图将图例移出地块并在地块旁边显示图例。有没有简单的方法可以做到这一点。我尝试legend_out
使用seaborn
包装提供的产品,但是没有用。
我的代码:
f,axes=plt.subplots(1,2,figsize=(8,4))
sns.factorplot(x="borough", y="pickups", hue="borough", kind='bar', data=n, size=4, aspect=2,ax=axes[0])
sns.factorplot(x="borough", y="pickups", hue="borough", kind='bar', data=low_pickups, size=4, aspect=2,ax=axes[1])
plt.close(2)
plt.show()
Run Code Online (Sandbox Code Playgroud)
以上代码的输出:
注意:我是python的新手,请在您的代码中提供解释。
数据帧的输出
#n dataframe
{'borough': {0: 'Bronx', 1: 'Brooklyn', 2: 'EWR', 3: 'Manhattan', 4: 'Queens', 5: 'Staten Island', 6: 'Unknown'}, 'pickups': {0: 50.66705042597283, 1: 534.4312687082662, 2: 0.02417683628827999, 3: 2387.253281142068, 4: 309.35482385447847, 5: 1.6018880957863229, 6: 2.0571804140650674}}
#low_pickups dataframe
{'borough': {2: 'EWR', 5: 'Staten Island', 6: 'Unknown'}, 'pickups': …
Run Code Online (Sandbox Code Playgroud) 所有,
我的数据集如下所示。我正在尝试使用fbProphet
或其他模型来预测未来6个月的“金额” 。但是我的问题是我想根据每个组(即A,B,C,D)预测未来6个月的数量。我不确定在python
使用fbProphet
或其他模型时该怎么做?我引用了fbprophet的官方页面,但我发现的唯一信息是“ Prophet”仅占据两列,一个是“ Date”,另一个是“ amount”。
我是python新手,因此对代码说明的任何帮助将不胜感激!
import pandas as pd
data = {'Date':['2017-01-01', '2017-02-01', '2017-03-01', '2017-04-01','2017-05-01','2017-06-01','2017-07-01'],'Group':['A','B','C','D','C','A','B'],
'Amount':['12.1','13','15','10','12','9.0','5.6']}
df = pd.DataFrame(data)
print (df)
Run Code Online (Sandbox Code Playgroud)
输出:
Date Group Amount
0 2017-01-01 A 12.1
1 2017-02-01 B 13
2 2017-03-01 C 15
3 2017-04-01 D 10
4 2017-05-01 C 12
5 2017-06-01 A 9.0
6 2017-07-01 B 5.6
Run Code Online (Sandbox Code Playgroud) 我的数据框如下所示。我正在使用 Pandas 合并功能来合并两个数据框,并且我正在尝试查找被删除的行。Pandas 或 python 有没有办法跟踪这个?
df1=pd.DataFrame(({'Name':('A','B','C'),'Age':(34,23,90)}))
df2=pd.DataFrame(({'Name':('A','B','D'),'Add':('rt','ct','pt')}))
pd.merge(df1,df2,on='Name')
Run Code Online (Sandbox Code Playgroud) 我有一个关于 R 中数据集的问题。mtcars
除了第一列之外,所有列都有名称,其中包含汽车名称,例如丰田花冠、马自达。有什么具体原因吗。如果是,我想知道原因。另外,我想知道我们是否可以对我们自己的数据集中的某一特定列执行相同的操作?如果是这样怎么办?
提前致谢!
我试图用箭头指向折线图中的最高点来注释折线图,并在绘图上显示箭头和最大值。我正在使用mtcars
数据集作为参考。下面是我的代码。
e <- df$mpg
ggplot(df, aes(x=e, y=df$hp)) +
geom_line() +
annotate("segment", color="blue", x=max(e), xend = max(e), y=max(df$hp),
yend=max(df$hp), arrow=arrow())
Run Code Online (Sandbox Code Playgroud)
提前致谢,
我的pandas
DataFrame
样子如下。我正在尝试从我的列中删除'$'
和然后应用到我的原始数据框上。所以我创建了下面的函数。但是,它给了我错误说','
income
"str" object has no attribute "str".
非常感谢有关如何解决此问题的任何建议。
注意:我是 python 新手,所以请提供解释。
我的数据框:
df1=pd.DataFrame(
{'Name': ['a', 'b','c','d'],
'income': ['$1', '$2,000','$10,000','$140,000']})
Run Code Online (Sandbox Code Playgroud)
我的功能:
def column_replace(x):
return x.str.replace('$', '').str.replace(',','').apply(lambda x: column_replace(x))
Run Code Online (Sandbox Code Playgroud) python ×5
pandas ×4
r ×2
annotations ×1
dataframe ×1
ggplot2 ×1
ggpmisc ×1
matplotlib ×1
plot ×1
seaborn ×1
string ×1
time-series ×1