小编Dat*_*wer的帖子

如果NaN存在于多列中的任何位置,则删除组

我正在尝试清理我的数据帧,如果我的"Base_2007"和"Base_2011"列包含NA,那么我应该完全删除该县.在我的情况下,因为两个县都包含NA,所以它们都将被删除.因此将返回空数据集.可以这样做吗?

数据:

  State  Year  Base_2007  Base_2011           County
0    AL  2012        NaN       14.0  Alabama_Country
1    AL  2013       12.0       20.0  Alabama_Country
2    AL  2014       13.0        NaN  Alabama_Country
3    DC  2011        NaN       20.0          Trenton
4    DC  2012       19.0        NaN          Trenton
5    DC  2013       20.0       21.0          Trenton
6    DC  2014       25.0       30.0          Trenton
Run Code Online (Sandbox Code Playgroud)

数据帧的尾部分:

{'State': {82550: 'WY', 82551: 'WY', 82552: 'WY', 82553: 'WY', 82554: 'WY', 82555: 'WY', 82556: 'WY', 82557: 'WY', 82558: 'WY', 82559: 'WY'}, 'County': {82550: 'Weston', 82551: 'Weston', 82552: 'Weston', 82553: 'Weston', …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

14
推荐指数
1
解决办法
504
查看次数

Seaborn Factorplot在实际图块下方生成额外的空图

所有,

我正在尝试使用subplots函数和Seaborn库来绘制两个Factorplots 。我可以使用下面的代码分别绘制两个图。但是,seaborn正在实际图下方生成额外的图(请参见下图)。有没有一种方法可以避免seaborn生成多余的空图?我试图plt.close摆脱地块,但不幸的是,它只是关闭了1个地块。此外,我试图将图例移出地块并在地块旁边显示图例。有没有简单的方法可以做到这一点。我尝试legend_out使用seaborn包装提供的产品,但是没有用。

我的代码:

f,axes=plt.subplots(1,2,figsize=(8,4))

sns.factorplot(x="borough", y="pickups", hue="borough", kind='bar', data=n, size=4, aspect=2,ax=axes[0])

sns.factorplot(x="borough", y="pickups", hue="borough", kind='bar', data=low_pickups, size=4, aspect=2,ax=axes[1])
plt.close(2)
plt.show()
Run Code Online (Sandbox Code Playgroud)

以上代码的输出:

在此处输入图片说明

注意:我是python的新手,请在您的代码中提供解释。

数据帧的输出

#n dataframe
{'borough': {0: 'Bronx', 1: 'Brooklyn', 2: 'EWR', 3: 'Manhattan', 4: 'Queens', 5: 'Staten Island', 6: 'Unknown'}, 'pickups': {0: 50.66705042597283, 1: 534.4312687082662, 2: 0.02417683628827999, 3: 2387.253281142068, 4: 309.35482385447847, 5: 1.6018880957863229, 6: 2.0571804140650674}}
#low_pickups dataframe
{'borough': {2: 'EWR', 5: 'Staten Island', 6: 'Unknown'}, 'pickups': …
Run Code Online (Sandbox Code Playgroud)

python plot visualization matplotlib seaborn

10
推荐指数
1
解决办法
2059
查看次数

如何使用fbProphet或其他模型在Python中执行包含多个组的时间序列分析?

所有,

我的数据集如下所示。我正在尝试使用fbProphet或其他模型来预测未来6个月的“金额” 。但是我的问题是我想根据每个组(即A,B,C,D)预测未来6个月的数量。我不确定在python使用fbProphet或其他模型时该怎么做?我引用了fbprophet的官方页面,但我发现的唯一信息是“ Prophet”仅占据两列,一个是“ Date”,另一个是“ amount”。

我是python新手,因此对代码说明的任何帮助将不胜感激!

import pandas as pd
data = {'Date':['2017-01-01', '2017-02-01', '2017-03-01', '2017-04-01','2017-05-01','2017-06-01','2017-07-01'],'Group':['A','B','C','D','C','A','B'],
       'Amount':['12.1','13','15','10','12','9.0','5.6']}
df = pd.DataFrame(data)
print (df)
Run Code Online (Sandbox Code Playgroud)

输出:

         Date Group Amount
0  2017-01-01     A   12.1
1  2017-02-01     B     13
2  2017-03-01     C     15
3  2017-04-01     D     10
4  2017-05-01     C     12
5  2017-06-01     A    9.0
6  2017-07-01     B    5.6
Run Code Online (Sandbox Code Playgroud)

python time-series pandas facebook-prophet

9
推荐指数
1
解决办法
1531
查看次数

在python中使用Pandas合并后如何找到丢失的数据?

我的数据框如下所示。我正在使用 Pandas 合并功能来合并两个数据框,并且我正在尝试查找被删除的行。Pandas 或 python 有没有办法跟踪这个?

df1=pd.DataFrame(({'Name':('A','B','C'),'Age':(34,23,90)}))
df2=pd.DataFrame(({'Name':('A','B','D'),'Add':('rt','ct','pt')}))
pd.merge(df1,df2,on='Name')
Run Code Online (Sandbox Code Playgroud)

python pandas

4
推荐指数
1
解决办法
1553
查看次数

为什么 R 中的 mtcars 数据集中没有汽车名称的列名称?

我有一个关于 R 中数据集的问题。mtcars除了第一列之外,所有列都有名称,其中包含汽车名称,例如丰田花冠、马自达。有什么具体原因吗。如果是,我想知道原因。另外,我想知道我们是否可以对我们自己的数据集中的某一特定列执行相同的操作?如果是这样怎么办?

提前致谢!

r

3
推荐指数
1
解决办法
3574
查看次数

如何用箭头和最大值注释线图?

我试图用箭头指向折线图中的最高点来注释折线图,并在绘图上显示箭头和最大值。我正在使用mtcars数据集作为参考。下面是我的代码。

e <- df$mpg
ggplot(df, aes(x=e, y=df$hp)) + 
  geom_line() + 
  annotate("segment", color="blue", x=max(e), xend = max(e), y=max(df$hp), 
            yend=max(df$hp), arrow=arrow())
Run Code Online (Sandbox Code Playgroud)

提前致谢,

annotations r ggplot2 ggpmisc

2
推荐指数
2
解决办法
1085
查看次数

AttributeError: 'str' 对象没有属性 'str'

我的pandas DataFrame样子如下。我正在尝试从我的列中删除'$'和然后应用到我的原始数据框上。所以我创建了下面的函数。但是,它给了我错误说','income"str" object has no attribute "str".

非常感谢有关如何解决此问题的任何建议。

注意:我是 python 新手,所以请提供解释。

我的数据框:

df1=pd.DataFrame(
     {'Name': ['a', 'b','c','d'],
     'income': ['$1', '$2,000','$10,000','$140,000']})
Run Code Online (Sandbox Code Playgroud)

我的功能:

def column_replace(x):
    return x.str.replace('$', '').str.replace(',','').apply(lambda x: column_replace(x))
Run Code Online (Sandbox Code Playgroud)

python string pandas

1
推荐指数
1
解决办法
3万
查看次数