这个问题已被问过很多次了,它似乎对其他人NaN有用,但是,当我从不同的DataFrame中复制一个列时,我得到了值(df1并且df2长度相同).
df1
date hour var1
a 2017-05-01 00:00:00 456585
b 2017-05-01 01:00:00 899875
c 2017-05-01 02:00:00 569566
d 2017-05-01 03:00:00 458756
e 2017-05-01 04:00:00 231458
f 2017-05-01 05:00:00 986545
Run Code Online (Sandbox Code Playgroud)
df2
MyVar1 MyVar2
0 6169.719338 3688.045368
1 5861.148007 3152.238704
2 5797.053347 2700.469871
3 5779.102340 2730.471948
4 6708.219647 3181.298291
5 8550.380343 3793.580394
Run Code Online (Sandbox Code Playgroud)
我需要这样的 df2
MyVar1 MyVar2 date hour
0 6169.719338 3688.045368 2017-05-01 00:00:00
1 5861.148007 3152.238704 2017-05-01 01:00:00
2 5797.053347 2700.469871 2017-05-01 02:00:00
3 …Run Code Online (Sandbox Code Playgroud) 目前我会这样做:
for x in [1,2,3]:
for y in [1,2,3]:
print x,y
Run Code Online (Sandbox Code Playgroud)
有办法做下面这样的事情,
for x,y in ([1,2,3],[1,2,3]):
print x,y
Run Code Online (Sandbox Code Playgroud)
想要缩短这种循环,这会引发"太多解压缩"异常.
我试图用经过预先训练和微调的DL模型预测验证数据.该代码遵循Keras博客中关于"使用非常少的数据构建图像分类模型"的示例.这是代码:
import numpy as np
from keras.preprocessing.image import ImageDataGenerator
import matplotlib.pyplot as plt
from keras.models import Sequential
from keras.models import Model
from keras.layers import Flatten, Dense
from sklearn.metrics import classification_report,confusion_matrix
from sklearn.metrics import roc_auc_score
import itertools
from keras.optimizers import SGD
from sklearn.metrics import roc_curve, auc
from keras import applications
from keras import backend as K
K.set_image_dim_ordering('tf')
# Plotting the confusion matrix
def plot_confusion_matrix(cm, classes,
normalize=False, #if true all values in confusion matrix is between 0 and 1
title='Confusion matrix',
cmap=plt.cm.Blues): …Run Code Online (Sandbox Code Playgroud) 我知道之前已经问过这个问题,但是,当我试图做一个if声明并且我收到错误时.我查看了这个链接,但在我的情况下没有多大帮助.我dfs是一个DataFrame列表.
我正在尝试以下方式,
for i in dfs:
if (i['var1'] < 3.000):
print(i)
Run Code Online (Sandbox Code Playgroud)
给出以下错误:
ValueError:Series的真值是不明确的.使用a.empty,a.bool(),a.item(),a.any()或a.all().
和我尝试以下,并得到同样的错误.
for i,j in enumerate(dfs):
if (j['var1'] < 3.000):
print(i)
Run Code Online (Sandbox Code Playgroud)
我的var1数据类型是float32.我没有使用任何其他logical运营商和&或|.在上面的链接中,似乎是因为使用了逻辑运算符.我为什么要这样ValueError?
我不知道如何在Visual Studio Project的Python工具中运行activate.bat.我的virtualenv项目中有一个目录环境.但是,我不知道如何./env/Scripts/activate.bat在项目运行我的主python脚本之前运行.
我正在查看面板数据,其结构如下:
D = \{(x^{(k)}_{t},y^{(k)}_{t})\,|\, k=1,\dots,N\, , t=t_0,\dots,t_k \}_{k=1}^{N}
其中 x^{(k)} 表示第 k' 个序列, x^{(k)}_{t} 表示时间 的第 k' 个序列值 t,此外 x^{(k)}_{i,t} 是i向量中的第 ' 个条目x^{(k)}_{t}。即时间 'th 序列x^{(k)}_{t}的特征向量。子脚本和超级脚本对于标签数据的含义相同,但此处为.kty^{(k)}_{t}y^{(k)}_{t} \in \{0,1\}
简单来说:数据集包含随时间观察的个体,对于观察个体的每个时间点,记录他是否购买了物品(y\in \{0,1\})。
我想使用带有来自 Keras 的 LSTM 单元的循环神经网络来预测一个人是否会在给定的时间点购买某件商品。我只能找到每个序列都有一个标签值(philipperemy link)的 RNN 的例子,而不是我描述的问题中每个序列元素都有一个标签值的例子。
到目前为止,我的方法是创建一个具有维度(样本、时间步长、特征)的张量,但我无法弄清楚如何格式化标签,以便keras将它们与特征相匹配。它应该是这样的 (samples,timesteps,1),其中最后一个维度表示包含标签值 0 或 1 的单个维度。
此外,我遇到的一些方法是拆分序列,以便将子序列添加到训练数据中,从而极大地增加了对内存的需求(mlmastery 链接)。这在我的情况下是不可行的,因为我有多个 GB 的数据,如果我添加子序列,我将无法将它存储在内存中。
我想使用的模型是这样的:
mod = Sequential()
mod.add(LSTM(30,input_dim=116, return_sequences = True))
mod.add(LSTM(10))
mod.add(Dense(2))
Run Code Online (Sandbox Code Playgroud)
有没有人有处理面板数据的经验keras …
我有一个列表列表,我想把它排成一行。我得到的最接近的是使用这篇文章。但是,我无法得到我的答案。
例如,假设我有一个testarray值,
([[ 26.85406494],
[ 27.85406494],
[ 28.85406494],
[ 29.85406494],
[ 30.85406494],
[ 31.85406494],
[ 32.85406494],
[ 33.85406494],
[ 34.85406494],
[ 35.85406494],
[ 36.85406494],
[ 37.85406494],
[ 38.85406494],
[ 39.85406494],
[ 40.85406494],
[ 41.85406494]])
Run Code Online (Sandbox Code Playgroud)
我需要像这样的pandasDataFrame 行,
Row_value
0 26.85406494
1 27.85406494
2 29.85406494
...
Run Code Online (Sandbox Code Playgroud)
我尝试了以下,
df = pd.DataFrame({'Row_value':testarray})
Run Code Online (Sandbox Code Playgroud)
我得到一个错误,
ValueError:如果使用所有标量值,则必须传递索引
如何通过索引传递这些值?
我有两个不同的DataFrame我要合并date和hours列.我看到了一些线程,但我无法找到解决问题的方法.我也阅读了这份文件,尝试了不同的组合,然而,效果并不好.
我的两个不同DataFrame的示例,
DF1
date hours var1 var2
0 2013-07-10 00:00:00 150.322617 52.225920
1 2013-07-10 01:00:00 155.250917 53.365296
2 2013-07-10 02:00:00 124.918667 51.158249
3 2013-07-10 03:00:00 143.839217 53.138251
.....
9 2013-09-10 09:00:00 148.135818 86.676341
10 2013-09-10 10:00:00 147.833517 53.658016
11 2013-09-10 12:00:00 149.580233 69.745368
12 2013-09-10 13:00:00 163.715317 14.524894
13 2013-09-10 14:00:00 168.856650 10.762779
Run Code Online (Sandbox Code Playgroud)
DF2
date hours myvar1 myvar2
0 2013-07-10 09:00:00 1.617 98.56
1 2013-07-10 10:00:00 2.917 23.60
2 2013-07-10 12:00:00 19.667 …Run Code Online (Sandbox Code Playgroud) 代码:检测对象中的 Opencv 线-> Amid 响应
情况1:
for xxx in contours:
[vx,vy,x,y] = cv2.fitLine(xxx,cv2.cv.CV_DIST_L2,0,0.01,0.01)
Run Code Online (Sandbox Code Playgroud)
它抛出错误 -
AttributeError:模块“cv2”没有属性“cv”
案例2:
for xxx in contours:
[vx,vy,x,y] = cv2.fitLine(xxx,cv2.CV_DIST_L2,0,0.01,0.01)
Run Code Online (Sandbox Code Playgroud)
它抛出错误 -
属性错误:模块“cv2”没有属性“CV_DIST_L2”
我已经opencv 3安装在我的机器上。我无法调试此错误。请让我知道我犯了什么错误?
我正在尝试使用此示例的NN模型。我正在为神经网络模型拟合值列表。但是,我得到一个AttributeError。这已经被问过并且已经得到回答。不幸的是,它对我不起作用。如示例所示,我创建了以下内容,
from keras.models import Sequential
from keras.wrappers.scikit_learn import KerasRegressor
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from keras.layers import Dense
def neuralnetmodel():
#Crete model
model = Sequential()
model.add(Dense(13, input_dim = 13, kernel_initializer = 'normal', activation = 'relu'))
model.add(Dense(1, kernel_initializer = 'normal', activation = 'relu'))
model.add(Dense(1, kernel_initializer = 'normal', activation = 'relu'))
## Output layer
model.add(Dense(1, kernel_initializer = 'normal'))
#Compile model
model.compile(loss = 'mean_squared_error', optimizer = 'adam')
return model
Run Code Online (Sandbox Code Playgroud)
fit 训练数据
NNmodelList = []
for i,j …Run Code Online (Sandbox Code Playgroud)