我有数据框
ID A B C
0 p 1 3 2
1 q 4 3 2
2 r 4 0 9
Run Code Online (Sandbox Code Playgroud)
我想创建一个字典,其中 ID 是键,B 是值,所以它将是:
d["q"] = 3 , d["r"] = 0
这样做的最佳方法是什么?
它与假设的重复不同,因为我想要每个键的单个值而不是列表
嗨,有我自己的语料库,我在上面训练了几个 Word2Vec 模型。对他们进行相互评估并选择最好的一种的最佳方法是什么?(显然不是手动 - 我正在寻找各种措施)。
值得注意的是,嵌入是针对项目而不是单词,因此我不能使用任何现有的基准。
谢谢!
我训练并保存了一个 gensim word2vec 模型:
W2V_MODEL_FN = r"C:\Users\models\w2v.model"
model = Word2Vec(X, size=150, window=3, min_count=2, workers=10)
model.train(X, total_examples=len(X), epochs=50)
model.save(W2V_MODEL_FN)
Run Code Online (Sandbox Code Playgroud)
进而:
w2v_model = Word2Vec.load(W2V_MODEL_FN)
Run Code Online (Sandbox Code Playgroud)
在一种环境中它可以完美运行,但在另一种环境中我得到错误:
{AttributeError}无法从“C:\Users\Anaconda3_New\envs\ISP_env\lib\site-packages\gensim\models\keyedvectors.py”中获取模块“gensim.models.keyedvectors”上的属性“Word2VecKeyedVectors”
所以我想这可能是一个包版本问题?
但我无法弄清楚它是什么。有任何想法吗?
谢谢!
Keras内置函数使用哪种算法嵌入?Word2vec?手套?其他?
nlp ×3
python ×3
word2vec ×2
data-science ×1
dataframe ×1
dictionary ×1
embedding ×1
gensim ×1
keras ×1
pandas ×1