我有多个字典,其中包含取决于其业务价值的数据,例如:
companies = {'google': 'value_1', 'facebook': 'value_2'}
names = {'alex': 'value_3', 'john': 'value_4'}
...
Run Code Online (Sandbox Code Playgroud)
我需要检查一个变量x是否包含在这些字典中的任何一个中,并确定它包含在哪些字典中。此类字典的数量可能很大,因此手动检查它们不是很有效。有没有比这更pythonic的东西
companies = {'google': 'value_1', 'facebook': 'value_2'}
names = {'alex': 'value_3', 'john': 'value_4'}
...
Run Code Online (Sandbox Code Playgroud) 基本上,我有一个DataFrame看起来像这样的:
c1 c2
0 a b
1 c d
2 e f
3 g h
Run Code Online (Sandbox Code Playgroud)
我需要将它转换为这个:
c1
0 a
1 b
2 c
3 d
4 e
...
Run Code Online (Sandbox Code Playgroud)
我知道如何从第二列获取所有值:
second_col_items = [df[['1']].iloc[i].item() for i in range(0,len(df.index))]
Run Code Online (Sandbox Code Playgroud)
但我坚持插入.我需要在循环中插入行,而且,我需要在现有行之间插入新行.它甚至可能吗?
所以,我的问题是:如何遍历列表(second_col_items在我的情况下)并将其值插入每个第二行DataFrame?提前致谢!
看完这篇文章后,我开始训练自己的模型.问题是,作者没有说清楚的东西sentences中 Word2Vec应该是这样的.
我从维基百科页面下载文本,因为它写的是文章,我从中列出了句子:
sentences = [word for word in wikipage.content.split('.')]
Run Code Online (Sandbox Code Playgroud)
所以,例如,sentences[0]看起来像:
'Machine learning is the subfield of computer science that gives computers the ability to learn without being explicitly programmed'
Run Code Online (Sandbox Code Playgroud)
然后我尝试使用此列表训练模型:
model = Word2Vec(sentences, min_count=2, size=50, window=10, workers=4)
Run Code Online (Sandbox Code Playgroud)
但该模型的字典由字母组成!例如,输出model.wv.vocab.keys()是:
dict_keys([',', 'q', 'D', 'B', 'p', 't', 'o', '(', ')', '0', 'V', ':', 'j', 's', 'R', '{', 'g', '-', 'y', 'c', '9', 'I', '}', '1', 'M', ';', '`', '\n', 'i', 'r', 'a', 'm', …Run Code Online (Sandbox Code Playgroud)