我需要对一组数字进行自相关,据我所知,它只是集合与自身的相关性.
我已经尝试使用numpy的相关函数,但我不相信结果,因为它几乎总是给出一个向量,其中第一个数字不是最大的,因为它应该是.
所以,这个问题实际上是两个问题:
numpy.correlate做什么?这是我在此的头一篇博文.我试图找到这个问题的答案,但无济于事.
刚刚在我的Win10机器上安装了Anaconda2(2.7.11 Python内核).我正在尝试学习conda命令.这是我的问题.
conda create -n myenv python=3.4命令创建虚拟environmant .activate myenv.conda env list它显示为活动状态(旁边的星形).print(sys.version).我做错了什么或者这只是Windows 10的问题.
提前谢谢,安迪
我是Scala的新手.我刚刚听到"eta扩展"一词,并且大致知道它意味着将方法扩展为函数对象.但我发现很少有资源可以系统地介绍它.
我很好奇eta扩展在Scala中是如何工作的.需要进行eta扩展的场景是什么?以及如何在Scala中实现eta扩展?
我大致知道在这种情况下:
def someMethod(x: Int): Int = x * x
Run Code Online (Sandbox Code Playgroud)
someMethod _ 将大致翻译成一个新的函数对象,如下所示:
new Function1[Int, Int] {
def apply(x: Int): Int = x * x
}
Run Code Online (Sandbox Code Playgroud)
是Scala的全部吗?
我有一个数据帧,我从一个csv文件加载,然后通过set_index方法将索引设置为少数列(通常是两个或三个).我们的想法是使用几个组合键访问数据框的各个部分,如下所示:
df.set_index(['fileName','phrase'])
df.ix['somePath','somePhrase']
Run Code Online (Sandbox Code Playgroud)
显然,只有当数据帧的多索引被分类到足够的深度时,才能进行这种具有多个键的选择.在这种情况下,由于im提供两个密钥,只有当数据帧多索引被分类到至少为2的深度时,.ix操作才会失败.
出于某种原因,当我设置如图所示的索引时,对我而言,似乎两个层都已排序,调用 set_index命令返回1,并且在尝试使用两个键访问时出现以下错误:MultiIndex
有帮助吗?
有几个来源解释有状态/无状态LSTM以及我已经读过的batch_size的作用.我稍后会在帖子中提及它们:
[ 1 ] https://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/
[ 2 ] https://machinelearningmastery.com/stateful-stateless-lstm-time-series-forecasting-python/
[ 3 ] http://philipperemy.github.io/keras-stateful-lstm/
[ 4 ] https://machinelearningmastery.com/use-different-batch-sizes-training-predicting-python-keras/
Ans还有其他SO线程,比如了解Keras LSTM和Keras - 有状态的vs无状态LSTM,但是并没有完全解释我正在寻找的东西.
我仍然不确定有关状态和确定batch_size的任务的正确方法是什么.
我有大约1000个独立的时间序列(samples),每个长度大约600天(timesteps)(实际上是可变长度,但我考虑将数据修剪到一个恒定的时间帧),input_dim每个时间步长有8个特征(或)(一些特征与每个样本相同,每个样本一些个体).
Input shape = (1000, 600, 8)
其中一个特征是我想要预测的特征,而其他特征(应该是)支持预测这一个"主要特征".我会为1000个时间序列中的每一个都这样做.什么是模拟这个问题的最佳策略?
Output shape = (1000, 600, 1)
从[ 4 ]:
Keras使用快速符号数学库作为后端,例如TensorFlow和Theano.
使用这些库的缺点是,无论您是在训练网络还是进行预测,数据的形状和大小都必须预先定义并保持不变.
[...]
当您希望进行的预测少于批量大小时,这确实会成为一个问题.例如,您可以获得批量较大的最佳结果,但需要在时间序列或序列问题等方面对一次观察进行预测.
这听起来像是一个"批处理"将沿着timesteps-dimension 分割数据.
但是,[ 3 ]指出:
换句话说,无论何时训练或测试LSTM,首先必须建立批量大小分割的输入
X形状矩阵.例如,如果和,则表示您的模型将接收64个样本的块,计算每个输出(无论每个样本的时间步数是多少),平均梯度并传播它以更新参数向量.nb_samples, timesteps, input_dimnb_samplesnb_samples=1024batch_size=64
当深入研究[ 1 ]和[ 4 ] 的例子时,Jason总是将他的时间序列分成几个只包含1个时间步长的样本(在他的例子中完全确定序列中下一个元素的前身).所以我认为批次实际上是沿着samples-axis …
我很抱歉,如果这是一个非常通用的问题,但是我环顾四周似乎无法找到答案.
我在Windows上运行node.js,它安装了2件东西,Nodejs.exe和Node.js命令提示符.我已经使用命令propt运行脚本,但我无法弄清楚exe版本的作用.我想使用的--debug标志似乎只适用于exe.它似乎与pyton idle类似,你可以键入d = 6然后d并返回数字6,但是我找不到它做的任何其他事情.
有人可以帮忙解释它的用途吗?万分感谢!
我正在尝试实现如下所示的ZCA Whitening算法:如何实现ZCA Whitening?在Scala中使用opencv的Python(使用Java api)但是我找不到那里使用的大部分函数(phython with numpy).
到目前为止,我试过这个:
正在加载图像:
val input = Imgcodecs.imread(img)
Imgproc.cvtColor(input, input, Imgproc.COLOR_BGR2GRAY)
input.convertTo(input, CvType.CV_64FC1)
Run Code Online (Sandbox Code Playgroud)
然后应用算法:
//Covariance matrix
val covar, mean = new Mat()
Core.calcCovarMatrix(input, covar, mean, Core.COVAR_NORMAL | Core.COVAR_ROWS)
Core.divide(covar, new Scalar(input.rows - 1), covar)
//Singular Value Decomposition
val w, u, vt = new Mat()
Core.SVDecomp(covar, w, u, vt, Core.SVD_FULL_UV)
//#Whitening constant, it prevents division by zero
val epsilon = 1e-5
Run Code Online (Sandbox Code Playgroud)
实施最后的转型
ZCAMatrix = np.dot(U, np.dot(np.diag(1.0/np.sqrt(S + epsilon)), U.T))
Run Code Online (Sandbox Code Playgroud)
我尝试过:
var ZCAMatrix = …Run Code Online (Sandbox Code Playgroud) 我已经在Windows 7上安装了Python 3.6(32位)。是否可以在不下载Anaconda,WinPython等的情况下安装Spyder?
我有一组(随机)浮点数.我想将每个值四舍五入到任意网格的限制.请参阅以下示例:
import numpy as np
np.random.seed(1)
# Setup
sample = np.random.normal(loc=20, scale=6, size=10)
intervals = [-np.inf, 10, 12, 15, 18, 21, 25, 30, np.inf]
# Round each interval up
for i in range(len(intervals) - 1):
sample[np.logical_and(sample > intervals[i], sample <= intervals[i+1])] = intervals[i+1]
Run Code Online (Sandbox Code Playgroud)
这导致:
[ 30. 18. 18. 15. 30. 10. inf 18. 25. 21.]
Run Code Online (Sandbox Code Playgroud)
我该如何避免for循环?我确信有一些方法可以使用我现在看不到的NumPy阵列魔法.
pandas.DataFrame.rollingpandas 0.22 的滚动窗口函数采用window如下所述的参数:
window:int或offset
移动窗口的大小.这是用于计算统计量的观测数.每个窗口都是固定大小.
如果是偏移量,那么这将是每个窗口的时间段.每个窗口将是基于时间段中包括的观察值而变化的大小.这仅适用于类似datetime的索引.这是0.19.0中的新功能
在这种情况下,实际上是一个偏移量?