小编vvk*_*itk的帖子

为什么word2vec为每个单词使用2个表示？

我试图理解为什么word2vec的skipgram模型对每个单词(隐藏表示,即单词嵌入)和输出表示(也称为上下文单词嵌入)有2个表示.这只是为了普遍性,上下文可以是任何东西(不仅仅是单词),还是有更基本的原因

word2vec

vvk*_*itk

lucky-day

12
推荐指数

2
解决办法

2916
查看次数

Word2Vec:使用的窗口大小的影响

我试图在非常短的短语(5克)上训练word2vec模型.由于每个句子或例子都很短,我相信我可以使用的窗口大小最多可以是2.我试图理解这么小的窗口大小对学习模型的质量有什么影响,这样我才能理解我的模型是否学到了有意义的东西.我尝试在5克上训练word2vec模型,但似乎学习模型不能很好地捕获语义等.

我使用以下测试来评估模型的准确性:https: //code.google.com/p/word2vec/source/browse/trunk/questions-words.txt

我使用gensim.Word2Vec来训练模型,这里是我的准确度分数的片段(使用2的窗口大小)

[{'correct': 2, 'incorrect': 304, 'section': 'capital-common-countries'},
 {'correct': 2, 'incorrect': 453, 'section': 'capital-world'},
 {'correct': 0, 'incorrect': 86, 'section': 'currency'},
 {'correct': 2, 'incorrect': 703, 'section': 'city-in-state'},
 {'correct': 123, 'incorrect': 183, 'section': 'family'},
 {'correct': 21, 'incorrect': 791, 'section': 'gram1-adjective-to-adverb'},
 {'correct': 8, 'incorrect': 544, 'section': 'gram2-opposite'},
 {'correct': 284, 'incorrect': 976, 'section': 'gram3-comparative'},
 {'correct': 67, 'incorrect': 863, 'section': 'gram4-superlative'},
 {'correct': 41, 'incorrect': 951, 'section': 'gram5-present-participle'},
 {'correct': 6, 'incorrect': 1089, 'section': 'gram6-nationality-adjective'},
 {'correct': 171, 'incorrect': 1389, 'section': 'gram7-past-tense'},
 {'correct': 56, …

Run Code Online (Sandbox Code Playgroud)

gensim word2vec

vvk*_*itk

lucky-day

10
推荐指数

2
解决办法

1万
查看次数

无法导入numpy:错误:/usr/lib/liblapack.so.3:undefined symbol:gotoblas

当我尝试导入numpy时,我收到以下错误:

/usr/local/lib/python2.7/dist-packages/numpy/linalg/__init__.py in <module>()
     49 from .info import __doc__
     50 
---> 51 from .linalg import *
     52 
     53 from numpy.testing import Tester

/usr/local/lib/python2.7/dist-packages/numpy/linalg/linalg.py in <module>()
     27     )
     28 from numpy.lib import triu, asfarray
---> 29 from numpy.linalg import lapack_lite, _umath_linalg
     30 from numpy.matrixlib.defmatrix import matrix_power
     31 from numpy.compat import asbytes

ImportError: /usr/lib/liblapack.so.3: undefined symbol: gotoblas

Run Code Online (Sandbox Code Playgroud)

我已经尝试过解决方案发布错误导入numpy:lapack_lite.so:未定义符号和GotoBLAS错误安装matplotlib与pip在virtualenv上debian wheezy

我已经尝试了以下所有选项:

vvkulkarni@galileo:~$ sudo update-alternatives --config liblapack.so.3
There are 3 choices for the alternative liblapack.so.3 (providing /usr/lib/liblapack.so.3).

  Selection    Path                                      Priority   Status …

Run Code Online (Sandbox Code Playgroud)

python numpy blas lapack openblas

vvk*_*itk

2017 05-23

10
推荐指数

2
解决办法

6861
查看次数

在交叉验证方面需要关于Vowpal Wabbit的一些指示

我的目标是在他们的参数空间中对各种VW模型进行网格搜索(尝试不同的损失函数和正则化等).由于模型可以使用多次传递,我想使用交叉验证.我想知道我是否应该实现自己的交叉验证代码(可能作为bash脚本)或者我是否重新发明轮子.关于这是否已在之前完成的任何指示或最佳方式继续进行将是有用的.我正在考虑在bash脚本中实现交叉验证,并使用GNU parallel来并行化Grid Search

vowpalwabbit

vvk*_*itk

lucky-day

7
推荐指数

1
解决办法

1962
查看次数