标签: data-analysis

如何通过两列或更多列对python pandas中的dataFrame进行排序？

假设我有一个包含列的数据框a,b并且c我想按列b升序排序数据帧,按列c降序排序,我该怎么做？

python sorting data-analysis python-2.7 pandas

Rak*_*van

2019 11-02

205
推荐指数

3
解决办法

23万
查看次数

实时时间序列数据中的峰值信号检测

更新:迄今为止 表现最佳的算法就是这个算法.

该问题探讨了用于检测实时时间序列数据中的突然峰值的稳健算法.

请考虑以下数据集:

p = [1 1 1.1 1 0.9 1 1 1.1 1 0.9 1 1.1 1 1 0.9 1 1 1.1 1 1 1 1 1.1 0.9 1 1.1 1 1 0.9 1, ...
     1.1 1 1 1.1 1 0.8 0.9 1 1.2 0.9 1 1 1.1 1.2 1 1.5 1 3 2 5 3 2 1 1 1 0.9 1 1 3, ... 
     2.6 4 3 3.2 2 1 1 0.8 4 4 …

Run Code Online (Sandbox Code Playgroud)

language-agnostic algorithm signal-processing time-series data-analysis

Jea*_*aul

2019 01-09

195
推荐指数

18
解决办法

14万
查看次数

为什么一个热门编码可以提高机器学习性能？

我注意到,当在特定数据集(矩阵)上使用One Hot编码并将其用作学习算法的训练数据时,与使用原始矩阵本身作为训练数据相比,它在预测准确性方面提供了明显更好的结果.这种性能提升如何发生？

machine-learning data-mining data-analysis scikit-learn

mah*_*kya

2017 10-20

123
推荐指数

1
解决办法

4万
查看次数

将多项式模型拟合为R中的数据

我已经阅读了这个问题的答案并且它们非常有用,但我需要特别是在R中提供帮助.

我在R中有一个示例数据集,如下所示:

x <- c(32,64,96,118,126,144,152.5,158)  
y <- c(99.5,104.8,108.5,100,86,64,35.3,15)

Run Code Online (Sandbox Code Playgroud)

我想为这些数据拟合一个模型y = f(x).我希望它是一个三阶多项式模型.

我怎么能在R？

另外,R可以帮我找到最合适的模型吗？

r curve-fitting data-analysis polynomial-math

Meh*_*lar

2017 05-23

80
推荐指数

4
解决办法

13万
查看次数

如何使用pandas对列中与给定条件匹配的值求和？

假设我有一个这样的列:

Run Code Online (Sandbox Code Playgroud)

我要总结的值b,其中a = 1,例如.这会给我5 + 7 + 3 = 15.

我怎么在熊猫里这样做？

python data-analysis dataframe pandas

adi*_*ijo

2016 12-12

53
推荐指数

2
解决办法

9万
查看次数

绘制Pandas GroupBy的结果

我开始学习熊猫,并试图找到最多的Pythonic(或panda-thonic？)方法来完成某些任务.

假设我们有一个包含A,B和C列的DataFrame.

A列包含布尔值:每行的A值为true或false.
B列有一些我们想要绘制的重要值.

我们想要发现的是A值设置为false的行的B值与A值为真的行的B值之间的细微差别.

换句话说,如何按列A的值(true或false)进行分组,然后在同一图表上绘制B列的值？两个数据集的颜色应不同,以便能够区分这些点.

接下来,让我们为这个程序添加另一个功能:在绘图之前,我们想为每一行计算另一个值并将其存储在D列中.这个值是记录前整个五分钟存储在B中的所有数据的平均值 - 但是我们只包含存储在A中的具有相同布尔值的行.

换句话说,如果我有一行A=True和time=t,我想计算列D的值,它是从时间t-5到t具有相同的所有记录的B的平均值A=True.

在这种情况下,我们如何在A的值上执行groupby,然后将此计算应用于每个单独的组,最后绘制两个组的D值？

python group-by matplotlib data-analysis pandas

Max*_*sky

lucky-day

39
推荐指数

1
解决办法

4万
查看次数

Python:pandas合并多个数据帧

我有不同的数据帧,需要根据日期列将它们合并在一起.如果我只有两个数据帧,我可以使用df1.merge(df2, on='date')它来做三个数据帧df1.merge(df2.merge(df3, on='date'), on='date'),但是,使用多个数据帧,它变得非常复杂和难以理解.

所有数据帧都有一个共同的列 - date但它们没有相同数量的行或列,我只需要每个日期对每个数据帧都是通用的那些行.

所以,我正在尝试编写一个递归函数,它返回一个包含所有数据的数据帧,但它不起作用.那么我应该如何合并多个数据帧呢？

我试图diferent的方式,得到了类似的错误out of range,keyerror 0/1/2/3和can not merge DataFrame with instance of type <class 'NoneType'>.

这是我写的脚本:

dfs = [df1, df2, df3] # list of dataframes

def mergefiles(dfs, countfiles, i=0):
    if i == (countfiles - 2): # it gets to the second to last and merges it with the last
        return

    dfm = dfs[i].merge(mergefiles(dfs[i+1], countfiles, i=i+1), on='date')
    return dfm

print(mergefiles(dfs, len(dfs)))

Run Code Online (Sandbox Code Playgroud)

一个例子:df_1: