小编use*_*145的帖子

如何在clf.predict_proba()中找到相应的类

我有许多类和相应的特征向量,当我运行predict_proba()时,我会得到这个:

classes = ['one','two','three','one','three']

feature = [[0,1,1,0],[0,1,0,1],[1,1,0,0],[0,0,0,0],[0,1,1,1]]

from sklearn.naive_bayes import BernoulliNB

clf = BernoulliNB()
clf.fit(feature,classes)
clf.predict_proba([0,1,1,0])
>> array([[ 0.48247836,  0.40709111,  0.11043053]])
Run Code Online (Sandbox Code Playgroud)

我想得到什么概率对应什么类.在这个页面上它说它们是按照算术顺序排序的,我不是100%肯定这意味着什么:http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn .svm.SVC.predict_proba

这是否意味着我已经通过我的训练示例将相应的索引分配给第一次遇到类,或者是否有类似的命令

clf.getClasses() = ['one','two','three']?

python machine-learning scikit-learn

41
推荐指数
3
解决办法
3万
查看次数

在Chrome开发者工具中输入CSS媒体查询

按F12我可以立即更改Chrome中元素的CSS.但是,我不能输入@media屏幕和(max-width)类似于这里:

http://www.w3schools.com/cssref/css3_pr_mediaquery.asp

当我按下输入它只是消失.如何动态添加和删除媒体查询?

在此输入图像描述

css media-queries google-chrome-devtools

25
推荐指数
3
解决办法
2万
查看次数

从包含python中的数字的列表中删除字符串

是否有一种简短的方法来删除包含数字的列表中的所有字符串?

例如

my_list = [ 'hello' , 'hi', '4tim', '342' ]
Run Code Online (Sandbox Code Playgroud)

会回来的

my_list = [ 'hello' , 'hi']
Run Code Online (Sandbox Code Playgroud)

python

14
推荐指数
2
解决办法
1万
查看次数

根据文本语料库Scikit-Learn中的出现列出词汇表中的单词

我已经装了CountVectorizer一些文件scikit-learn.我想在文本语料库中看到所有术语及其相应的频率,以便选择停用词.例如

'and' 123 times, 'to' 100 times, 'for' 90 times, ... and so on
Run Code Online (Sandbox Code Playgroud)

这有什么内置功能吗?

python text-extraction machine-learning scikit-learn

13
推荐指数
2
解决办法
8398
查看次数

Jquery position()包括保证金

如果我想在测量元素宽度时包含边距我可能会调用element.outerWidth(true);但是,我找不到类似的方法来获取容器中元素的左偏移量,其中包含边距.element.position().left不包括保证金.

我已经尝试过element[0].getBoundingClientRect().left,但是有效,但有一个类似的jquery调用吗?

编辑:似乎上面的本机JavaScript调用也没有给我保证金..

javascript jquery position

13
推荐指数
1
解决办法
1万
查看次数

获取字符串中某个位置的单词

我想得到字符串中某个位置周围的单词.例如,之后的两个单词和之前的两个单词.

例如,考虑字符串:

String str = "Hello my name is John and I like to go fishing and hiking I have two sisters and one brother.";
String find = "I";

for (int index = str.indexOf("I"); index >= 0; index = str.indexOf("I", index + 1))
{
    System.out.println(index);
}
Run Code Online (Sandbox Code Playgroud)

这写出了单词"I"所在的索引.但我希望能够得到这些位置周围的单词的子串.

我希望能够打印出"John and I like to"和"and hiking I have have two".

不仅应该能够选择单个字符串.搜索"John and"将返回"name is John and I like".

这样做有什么简洁明智的方法吗?

java string

9
推荐指数
1
解决办法
7024
查看次数

AngularJS父指令与child指令通信

考虑两个带有隔离范围的嵌套指令:

<dctv1>
    <dctv2></dctv2>
<dctv1>
Run Code Online (Sandbox Code Playgroud)

如果我想dctv2dctv1我交谈,我可以选择:

  1. 我可能要求控制器dctv1在定义中dctv2使用require:'^dctv1'
  2. 我可以调用对父范围的表达与包装<dctv2 callParent="hello()"></dctv2>scope:{callParent:'&'}
  3. 我也可以用$scope.$emitdctv2后来所有父范围会听到该消息.

现在我想dctv1谈谈dctv2.

  1. 我可以实现这一目标的唯一方法就是使用$scope.$broadcast,但所有孩子都会听到.

通过这里谈话,我的意思是称为函数或类似函数.不想设置堵塞digestloop的手表.

如何以最佳方式进行dctv1通知dctv2,使它们松散耦合?我应该能够删除dctv2而不会出错.

javascript angularjs

9
推荐指数
1
解决办法
1886
查看次数

matplotlib中的历史记录:区域不居中,轴上的比例不正确

看看这个例子:

 import matplotlib.pyplot as plt
 l = [3,3,3,2,1,4,4,5,5,5,5,5,5,5,5,5]
 plt.hist(l,normed=True)
 plt.show()
Run Code Online (Sandbox Code Playgroud)

输出以图片形式发布.我有两个问题:

a)为什么只有4和5个箱子以其价值为中心?其他人不应该这样吗?是否有诀窍让他们居中?

b)为什么垃圾箱没有按比例标准化?我希望所有箱子的y值总和为1.

请注意,我的真实示例在列表中包含更多值,但它们都是离散的.

在此输入图像描述

python numpy matplotlib

8
推荐指数
1
解决办法
1万
查看次数

Numpy max pooling convolution

编辑:

我真正想要做的是找到局部最大值,这在下面解释得很好,同样的解决方案也在这里解释:

http://scikit-image.org/docs/dev/auto_examples/plot_peak_local_max.html




看来你可以在Numpy 做线性卷积.

是否可以进行非线性最大池化卷积?使用NxM补丁并跨越输入图像,如果当前像素不是附近的最大像素,则归零?

所以非线性最大卷积就像这样,这是我的形象

  3 4 5 2 3
  3 5 1 2 7
  2 2 5 1 7
Run Code Online (Sandbox Code Playgroud)

给定2x2最大池值给出此输出

  0 0 5 0 0
  0 5 0 0 7
  0 0 5 0 7
Run Code Online (Sandbox Code Playgroud)

你有一个2x2补丁跨越图像,并将所有内容归零,只保留最大值.

python numpy

8
推荐指数
1
解决办法
6600
查看次数

结合TF-IDF(余弦相似度)和pagerank?

给定一个查询,我有一个文档的余弦分数.我也有文件pagerank.是否有标准的好方法将两者结合起来?

我在考虑增加它们

 Total_Score = cosine-score * pagerank
Run Code Online (Sandbox Code Playgroud)

因为如果你在pagerank或cosine-score上得到低分,那么文档就不那么有趣了.

或者最好是加权和?

Total_Score = weight1 * cosine-score + weight2 * pagerank
Run Code Online (Sandbox Code Playgroud)

这是否更好?然后你可能有零余弦分数,但是高分页,并且页面将显示在结果中.

search search-engine tf-idf cosine-similarity

7
推荐指数
1
解决办法
3411
查看次数