我想计算一组循环数据的平均值.例如,我可能会从阅读指南中获得几个样本.问题当然是如何处理环绕.相同的算法可能对时钟表有用.
实际问题更复杂 - 统计在球体上或在"包裹"的代数空间中意味着什么,例如添加剂组mod n.答案可能不是唯一的,例如359度和1度的平均值可能是0度或180度,但统计上0看起来更好.
这对我来说是一个真正的编程问题,我试图让它看起来不像是一个数学问题.
我想使用NumPy执行以下MATLAB代码的等价物:repmat([1; 1], [1 1 1])
.我怎么做到这一点?
我在使用Python,iPython和库时遇到了麻烦.以下几点显示了问题链.我在Mac Lion上运行Python 2.7.
我尝试过其他一些我从其他博客中遇到的事情.但是他们都没有帮助,也不幸的是我不知道我在做些什么.例如:我尝试使用easy_install和pip卸载并重新安装ipython.我还尝试通过自制程序重新安装所有内容,并修改路径.bash_profile.
我希望这个问题不会成为"问答"问题......这里说:(多)共线性是指回归模型中预测变量之间的极高相关性.如何治愈它们......好吧,有时你不需要"治愈"共线性,因为它不会影响回归模型本身,而是解释个体预测因子的影响.
发现共线性的一种方法是将每个预测变量作为因变量,将其他预测变量作为自变量,确定R 2,如果它大于.9(或.95),我们可以考虑预测变量冗余.这是一种"方法"......其他方法呢?其中一些是耗时的,比如从模型中排除预测变量并观察b系数变化 - 它们应该明显不同.
当然,我们必须始终牢记分析的具体背景/目标......有时候,唯一的补救措施就是重复研究,但是现在,我对以多种共线性(多)共线性筛选冗余预测因子的各种方式感兴趣发生在回归模型中.
我目前正在使用std::ofstream
如下:
std::ofstream outFile;
outFile.open(output_file);
Run Code Online (Sandbox Code Playgroud)
然后我尝试将std::stringstream
对象传递给outFile
如下:
GetHolesResults(..., std::ofstream &outFile){
float x = 1234;
std::stringstream ss;
ss << x << std::endl;
outFile << ss;
}
Run Code Online (Sandbox Code Playgroud)
现在我只outFile
包含垃圾:"0012E708"重复了一遍.
在GetHolesResults
我可以写
outFile << "Foo" << std:endl;
Run Code Online (Sandbox Code Playgroud)
并且它将正确输出outFile
.
关于我做错了什么的任何建议?
我有一个脚本,生成二维numpy
array
s dtype=float
和形状的顺序(1e3, 1e6)
.现在我正在使用np.save
并使用np.load
数组执行IO操作.但是,每个阵列的这些功能需要几秒钟.是否有更快的方法来保存和加载整个数组(即,不对其内容进行假设并减少它们)?array
只要数据保留完全,我就可以在保存之前将s 转换为另一种类型.
假设我有以下DataFrame:
In [1]: df
Out[1]:
apple banana cherry
0 0 3 good
1 1 4 bad
2 2 5 good
Run Code Online (Sandbox Code Playgroud)
这按预期工作:
In [2]: df['apple'][df.cherry == 'bad'] = np.nan
In [3]: df
Out[3]:
apple banana cherry
0 0 3 good
1 NaN 4 bad
2 2 5 good
Run Code Online (Sandbox Code Playgroud)
但这不是:
In [2]: df[['apple', 'banana']][df.cherry == 'bad'] = np.nan
In [3]: df
Out[3]:
apple banana cherry
0 0 3 good
1 1 4 bad
2 2 5 good
Run Code Online (Sandbox Code Playgroud)
为什么?如何在不必写出两行的情况下实现'apple'和'banana'值的转换,如
In [2]: df['apple'][df.cherry == …
Run Code Online (Sandbox Code Playgroud) 我有两个具有形状N X T
和数组的阵列M X T
.我想计算T
每对可能的行n
和m
(分别来自N
和M
)之间的相关系数.
什么是最快,最pythonic的方式来做到这一点?(循环过来N
,M
在我看来既不快也不是pythonic.)我期待答案涉及numpy
和/或scipy
.现在我的数组是numpy
array
s,但我愿意将它们转换为不同的类型.
我期待我的输出是一个形状的数组N X M
.
NB当我说"相关系数"时,我的意思是Pearson乘积矩相关系数.
以下是一些需要注意的事项:
numpy
函数correlate
要求输入数组为一维.numpy
函数corrcoef
接受二维数组,但它们必须具有相同的形状.scipy.stats
函数pearsonr
要求输入数组为一维.我刚刚在我的笔记本电脑上安装了IPython
3.0 pip
,运行Ubuntu
14.04:
$ pip search ipython
ipython-cluster-helper - Simplify IPython cluster start up and use for
multiple schedulers.
ipython - IPython: Productive Interactive Computing
INSTALLED: 3.0.0 (latest)
Run Code Online (Sandbox Code Playgroud)
但是,当我去使用时IPython
,终端似乎认为它使用的是1.2.1版本:
$ ipython
Python 2.7.6 (default, Mar 22 2014, 22:59:38)
Type "copyright", "credits" or "license" for more information.
IPython 1.2.1 -- An enhanced Interactive Python.
? -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help -> Python's own help system.
object? -> Details …
Run Code Online (Sandbox Code Playgroud) python ×5
numpy ×3
arrays ×2
ipython ×2
algorithm ×1
c++ ×1
correlation ×1
geometry ×1
io ×1
json ×1
math ×1
matlab ×1
ofstream ×1
pandas ×1
parameters ×1
performance ×1
r ×1
regression ×1
scipy ×1
statistics ×1
stl ×1
stringstream ×1
ubuntu ×1
ubuntu-14.04 ×1