标签: correlation

卷积与相关性

任何人都可以向我解释相关和卷积的相似点和不同点吗?请解释背后的直觉,而不是数学方程(即翻转内核/脉冲).每个类别的图像处理域中的应用示例也将受到赞赏

signals signal-processing image-processing convolution correlation

20
推荐指数
3
解决办法
3万
查看次数

Pandas Correlation Groupby

假设我有一个类似于下面的数据帧,我如何得到2个特定列之间的相关性,然后按"ID"列分组?我相信Pandas'corr'方法可以找到所有列之间的相关性.如果可能的话,我也想知道如何使用.agg函数(即np.correlate)找到'groupby'相关性.

是)我有的:

ID  Val1    Val2    OtherData   OtherData
A   5       4       x           x
A   4       5       x           x
A   6       6       x           x
B   4       1       x           x
B   8       2       x           x
B   7       9       x           x
C   4       8       x           x
C   5       5       x           x
C   2       1       x           x
Run Code Online (Sandbox Code Playgroud)

我需要的:

ID  Correlation_Val1_Val2
A   0.12
B   0.22
C   0.05
Run Code Online (Sandbox Code Playgroud)

谢谢!

python group-by correlation pandas

20
推荐指数
3
解决办法
2万
查看次数

C#中两个数组的相关性

有两个double值数组,我想计算相关系数(单个double值,就像MS Excel中的CORREL函数一样).C#中有一些简单的单行解决方案吗?

我已经发现了名为Meta Numerics的数学库.根据这个问题,它应该做的工作.是Meta Numerics相关方法的文档,我没有得到.

可以请某人为我提供简单的代码片段或示例如何使用该库?

注意:最后,我被迫使用一种自定义实现.但是,如果有人在阅读这个问题时知道好的,有良好记录的C#数学库/框架来做到这一点,请不要犹豫,并在回答中发布一个链接.

.net c# arrays correlation

19
推荐指数
4
解决办法
3万
查看次数

为什么NUMPY相关并且corrcoef返回不同的值以及如何在"完整"模式中"标准化"相关性?

我正在尝试使用Numpy在Python中使用一些时间序列分析.

我有两个中等大小的系列,每个都有20k值,我想检查滑动相关性.

corrcoef给我输出一个自相关/相关系数矩阵.在我的案例中没有任何有用的东西,因为其中一个系列包含滞后.

相关函数(在mode ="full"中)返回一个40k元素列表,看起来像我想要的结果类型(峰值远离列表中心,如滞后所示),但是这些值都很奇怪 - 高达500,当我期待从-1到1的东西时.

我不能把它全部除以最大值; 我知道最大相关性不是1.

我怎样才能规范化"互相关"("完全"模式中的相关性),因此返回值将是每个滞后步骤的相关性,而不是那些非常大的奇怪值?

python numpy time-series normalization correlation

18
推荐指数
1
解决办法
2万
查看次数

大熊猫栏目相关性具有统计学意义

给出一个pandas数据帧df,以获得其列df.1与之间的相关性,最好的方法是什么df.2

我不希望输出计数行NaN,pandas内置的相关性.但我也希望它输出一个pvalue或一个标准错误,内置的错误.

SciPy 似乎被NaN追上了,尽管我相信它确实具有重要意义.

数据示例:

     1           2
0    2          NaN
1    NaN         1
2    1           2
3    -4          3
4    1.3         1
5    NaN         NaN
Run Code Online (Sandbox Code Playgroud)

python scipy correlation pandas

17
推荐指数
5
解决办法
4万
查看次数

按行划分2个数据帧之间的R相关性

我有2个数据帧w/5列和每行100行.

id       price1      price2     price3     price4     price5
 1         11.22      25.33      66.47      53.76      77.42
 2         33.56      33.77      44.77      34.55      57.42
...
Run Code Online (Sandbox Code Playgroud)

我想基本上得到相应行的相关性

for(i in 1:100){    
cor(df1[i, 1:5], df2[i, 1:5])    
}
Run Code Online (Sandbox Code Playgroud)

但没有使用for循环.我假设有一些plyr用来做它但似乎无法做到正确.有什么建议?

r plyr correlation dataframe

16
推荐指数
2
解决办法
1万
查看次数

使用Numpy生成随机相关的x和y点

我想生成x和y坐标的相关数组,以便测试各种matplotlib绘图方法,但我在某处失败了,因为我不能numpy.random.multivariate_normal给我想要的样本.理想情况下,我希望我的x值介于-0.51和51.2之间,我的y值介于0.33和51.6之间(虽然我认为相等的范围可以,因为我之后可以约束该情节),但我不确定是什么意思(我应该使用0,0?)和协方差值来从函数中获取这些样本.

python random numpy normal-distribution correlation

16
推荐指数
1
解决办法
1万
查看次数

矩阵的所有行对的相关系数和p值

我有一个矩阵data行和Ñ列.我曾经使用以下方法计算所有行对之间的相关系数np.corrcoef:

import numpy as np
data = np.array([[0, 1, -1], [0, -1, 1]])
np.corrcoef(data)
Run Code Online (Sandbox Code Playgroud)

现在我还想看看这些系数的p值.np.corrcoef不提供这些; scipy.stats.pearsonr确实.但是,scipy.stats.pearsonr不接受输入矩阵.

是否有一个快速的方法如何计算两个系数和所有对行(抵达例如在两个p值,而不必手动经过矩阵,一个相关系数,其他与对应的p值)所有对?

python statistics numpy scipy correlation

16
推荐指数
2
解决办法
2万
查看次数

如何关联大熊猫中的分类栏?

我有一个df非数字列的DataFrame CatColumn.

   A         B         CatColumn
0  381.1396  7.343921  Medium
1  481.3268  6.786945  Medium
2  263.3766  7.628746  High
3  177.2400  5.225647  Medium-High
Run Code Online (Sandbox Code Playgroud)

我想CatColumn将相关性分析包含在Dataframe中的其他列中.我试过DataFrame.corr但它不包括相关性分析中具有名义值的列.

python correlation pandas scikit-learn categorical-data

16
推荐指数
1
解决办法
1万
查看次数

如何在corrplot中更改相关系数的字体大小?

我正在用corrplot绘制相关图.我想绘制相关系数:

require(corrplot)
test <- matrix(data = rnorm(400), nrow=20, ncol=20)
corrplot(cor(test), method = "color", addCoef.col="grey", order = "AOE")
Run Code Online (Sandbox Code Playgroud)

但它们在情节中太大了:

在此输入图像描述

有没有办法让coefficent的字体更小?我一直在看,?corrplot但只有参数可以更改图例和轴字体大小(cl.cextl.cex).pch.cex也不起作用.

r correlation r-corrplot

15
推荐指数
3
解决办法
3万
查看次数