我有一套trainFeatures和一组testFeatures带有正面,中性和负面标签:
trainFeats = negFeats + posFeats + neutralFeats
testFeats = negFeats + posFeats + neutralFeats
Run Code Online (Sandbox Code Playgroud)
例如,trainFeatsis 里面有一个条目
(['blue', 'yellow', 'green'], 'POSITIVE')
Run Code Online (Sandbox Code Playgroud)
对于测试功能列表也是如此,因此我为每个集指定了标签.我的问题是如何使用随机森林分类器和SVM的scikit实现来获得这个分类器的准确性与每个类的精确度和召回分数?问题是我目前正在使用单词作为功能,而从我读到的这些分类器需要数字.有没有办法在不改变功能的情况下实现我的目的?非常感谢!
我无法找到一种有效的方法来从Haskell中的9个元素列表中挑选出4个元素的所有排列.python方式做同样的事情:
itertools.permutations(range(9+1),4)
Run Code Online (Sandbox Code Playgroud)
在Haskell中这样做不太有效:
nub . (map (take 4)) . permutations $ [1..9]
Run Code Online (Sandbox Code Playgroud)
我想找到类似的东西:
permutations 4 [1..9]
Run Code Online (Sandbox Code Playgroud) 这个
from __future__ import print_function
from functools import partial
from itertools import imap, product
identity = lambda x: x
identity.__repr__ = 'id'
map_identity = partial(map, identity)
map_identity.__repr__ = 'map'
imap_identity = partial(imap, identity)
imap_identity.__repr__ = 'imap'
prod_map = partial(product, repeat=1)
prod_map.__repr__ = 'prod'
list(map(
lambda (f, g):
print(
"{f_repr:4}(range(10)) compare {g_repr:4}(range(10)): "\
"{{ less: {less:1}, equal: {equal:1}}}".format(
f_repr=f.__repr__,
g_repr=g.__repr__,
less=f(range(16))<g(range(16)),
equal=f(range(16))==g(range(16)),
)
),
product([identity, map_identity, imap_identity, prod_map], repeat=2)
))
Run Code Online (Sandbox Code Playgroud)
回报
id (range(10)) compare id (range(10)): { less: 0, equal: 1} …Run Code Online (Sandbox Code Playgroud) 如果每个条目都有一个分隔符(在本例中为','):
axis1,axis2,axis3,
1, 2, 3,
2, 3, 4,
Run Code Online (Sandbox Code Playgroud)
或不:
axis1,axis2,axis3
1, 2, 3
2, 3, 4
Run Code Online (Sandbox Code Playgroud)
在.csv或这只是不同的方言?