数据框:
pair = collections.defaultdict(collections.Counter)
Run Code Online (Sandbox Code Playgroud)
例如
pair = {'doc1': {'word1':4, 'word2':3},
'doc2': {'word1':2, 'word3':4},
'doc3': {'word2':2, 'word4':1},
...}
Run Code Online (Sandbox Code Playgroud)
我想保留数据框但是改变这个部分的类型{'word1':4, 'word2':3} {'word1':2, 'word3':4}``...它现在是一个Counter我需要一个dict.
我试过这个来获取数据pair,但我不知道如何dict为每个doc 创建一个:
new_pair = collections.defaultdict(collections.Counter)
for doc, tab in testing.form.items():
for word, freq in tab.items():
new_pair[doc][word] = freq
Run Code Online (Sandbox Code Playgroud)
我不想改变输出.我只需要在每个doc中,数据类型dict不是Counter.
preresult是一个OrderedDict().
我想保存前100个元素.或者保留preresult但删除除前100个元素之外的所有内容.
结构是这样的
stats = {'a': {'email1':4, 'email2':3},
'the': {'email1':2, 'email3':4},
'or': {'email1':2, 'email3':1}}
Run Code Online (Sandbox Code Playgroud)
Will islice会为它工作吗?我告诉itertool.islice没有items
我有一个单词的字面.对于dict中的每个键,我想在文章中找到它的频率.
在我打开文章后,我做了
for k, v in sourted_key.items():
for token in re.findall(k, data)
token[form] += 1
Run Code Online (Sandbox Code Playgroud)
在're.findall(k,data)'键中必须是字符串.但是这个词中的关键不是.我想搜索键.还有其他方法吗?请注意,KEYS包含许多PUNCTUATIONS.
例如,如果钥匙是'手'.它只匹配手.钱德勒,不方便.
来自.txt的数据:
ABC 12 34 24
edf 23 15 63
hre 41 3 356
...
...
Run Code Online (Sandbox Code Playgroud)
我想在一组中保存每个单词(在第一列中).对于集合中的每个元素,都有一个包含其后每个数字的列表.EG字[ABC] [1] = 34,字[hre] [2] = 356.
我在网上找不到任何有用的信息.
例如D,如果sum_p不为零.
D = 1/sum_p if sum_p \
else 0
Run Code Online (Sandbox Code Playgroud)
如果我想返回值怎么办?我应该这样做:
return 1/sum_p if sum_p \
else 0
Run Code Online (Sandbox Code Playgroud)
或者只是写
if...
else: return 0
Run Code Online (Sandbox Code Playgroud) 我没有在本地sshing机器上运行开发服务器,而是在另一台机器上运行.
我尝试通过查找IP地址来更改运行开发服务器的位置(使用ifconfig命令并查找与eth0关联的地址),并运行dev服务器,如下所示:
python manage.py runserver <ipaddress>:8000
Run Code Online (Sandbox Code Playgroud)
但是当我http://<ipaddress>:8000在浏览器中输入URL时,我得到了cannot connect to the website.
有任何想法吗?