我正在使用http://adventuresinmachinelearning.com/word2vec-keras-tutorial/中的实现来学习有关word2Vec的知识。我不明白的是为什么损失函数没有减少?
Iteration 119200, loss=0.7305528521537781
Iteration 119300, loss=0.6254740953445435
Iteration 119400, loss=0.8255964517593384
Iteration 119500, loss=0.7267132997512817
Iteration 119600, loss=0.7213149666786194
Iteration 119700, loss=0.6156617999076843
Iteration 119800, loss=0.11473365128040314
Iteration 119900, loss=0.6617216467857361
Run Code Online (Sandbox Code Playgroud)
据我了解,该网络是用于此任务的标准网络:
input_target = Input((1,))
input_context = Input((1,))
embedding = Embedding(vocab_size, vector_dim, input_length=1, name='embedding')
target = embedding(input_target)
target = Reshape((vector_dim, 1))(target)
context = embedding(input_context)
context = Reshape((vector_dim, 1))(context)
dot_product = Dot(axes=1)([target, context])
dot_product = Reshape((1,))(dot_product)
output = Dense(1, activation='sigmoid')(dot_product)
model = Model(inputs=[input_target, input_context], outputs=output)
model.compile(loss='binary_crossentropy', optimizer='rmsprop') #adam??
Run Code Online (Sandbox Code Playgroud)
单词来自http://mattmahoney.net/dc/text8.zip(英语)中大小为10000的词汇表
我注意到的是,有些单词在时间上有所了解,例如数字和文章的上下文很容易猜到,但损失从一开始就一直停留在0.7左右,并且随着迭代的进行,它只会随机波动。
训练部分是这样制作的(由于缺少标准的拟合方法,我感到很奇怪)
arr_1 = …
Run Code Online (Sandbox Code Playgroud) 我找不到任何人类解释:如何创建一系列列表,如:
std::list<int> mylist[size] ?
Run Code Online (Sandbox Code Playgroud)
如果我把它放在我的程序中,它会编译但会产生一些问题,因为它不会执行任何代码(如果我写出mylist w/out [size],其余代码就可以正常工作)
我正在读某个地方,不推荐使用C的原始数组; 有什么选择?
谢谢抱歉
我有以下数据帧:
mean std
insert quality
0.0 good 0.009905 0.003662
0.1 good 0.450190 0.281895
poor 0.376818 0.306806
0.2 good 0.801856 0.243288
poor 0.643859 0.322378
0.3 good 0.833235 0.172025
poor 0.698972 0.263266
0.4 good 0.842288 0.141925
poor 0.706708 0.241269
0.5 good 0.853634 0.118604
poor 0.685716 0.208073
0.6 good 0.845496 0.118609
poor 0.675907 0.207755
0.7 good 0.826335 0.133820
poor 0.656934 0.222823
0.8 good 0.829707 0.130154
poor 0.627111 0.213046
0.9 good 0.816636 0.137371
poor 0.589331 0.232756
1.0 good 0.801211 0.147864
poor 0.554589 0.245867
Run Code Online (Sandbox Code Playgroud)
如果想要绘制2条曲线(点+误差),使用索引列作为X轴 …