我有许多类和相应的特征向量,当我运行predict_proba()时,我会得到这个:
classes = ['one','two','three','one','three']
feature = [[0,1,1,0],[0,1,0,1],[1,1,0,0],[0,0,0,0],[0,1,1,1]]
from sklearn.naive_bayes import BernoulliNB
clf = BernoulliNB()
clf.fit(feature,classes)
clf.predict_proba([0,1,1,0])
>> array([[ 0.48247836, 0.40709111, 0.11043053]])
Run Code Online (Sandbox Code Playgroud)
我想得到什么概率对应什么类.在这个页面上它说它们是按照算术顺序排序的,我不是100%肯定这意味着什么:http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html#sklearn .svm.SVC.predict_proba
这是否意味着我已经通过我的训练示例将相应的索引分配给第一次遇到类,或者是否有类似的命令
clf.getClasses() = ['one','two','three']?
按F12我可以立即更改Chrome中元素的CSS.但是,我不能输入@media屏幕和(max-width)类似于这里:
http://www.w3schools.com/cssref/css3_pr_mediaquery.asp
当我按下输入它只是消失.如何动态添加和删除媒体查询?
是否有一种简短的方法来删除包含数字的列表中的所有字符串?
例如
my_list = [ 'hello' , 'hi', '4tim', '342' ]
Run Code Online (Sandbox Code Playgroud)
会回来的
my_list = [ 'hello' , 'hi']
Run Code Online (Sandbox Code Playgroud) 我已经装了CountVectorizer
一些文件scikit-learn
.我想在文本语料库中看到所有术语及其相应的频率,以便选择停用词.例如
'and' 123 times, 'to' 100 times, 'for' 90 times, ... and so on
Run Code Online (Sandbox Code Playgroud)
这有什么内置功能吗?
如果我想在测量元素宽度时包含边距我可能会调用element.outerWidth(true);
但是,我找不到类似的方法来获取容器中元素的左偏移量,其中包含边距.element.position().left
不包括保证金.
我已经尝试过element[0].getBoundingClientRect().left
,但是有效,但有一个类似的jquery调用吗?
编辑:似乎上面的本机JavaScript调用也没有给我保证金..
我想得到字符串中某个位置周围的单词.例如,之后的两个单词和之前的两个单词.
例如,考虑字符串:
String str = "Hello my name is John and I like to go fishing and hiking I have two sisters and one brother.";
String find = "I";
for (int index = str.indexOf("I"); index >= 0; index = str.indexOf("I", index + 1))
{
System.out.println(index);
}
Run Code Online (Sandbox Code Playgroud)
这写出了单词"I"所在的索引.但我希望能够得到这些位置周围的单词的子串.
我希望能够打印出"John and I like to"和"and hiking I have have two".
不仅应该能够选择单个字符串.搜索"John and"将返回"name is John and I like".
这样做有什么简洁明智的方法吗?
考虑两个带有隔离范围的嵌套指令:
<dctv1>
<dctv2></dctv2>
<dctv1>
Run Code Online (Sandbox Code Playgroud)
如果我想dctv2
和dctv1
我交谈,我可以选择:
dctv1
在定义中dctv2
使用require:'^dctv1'
<dctv2 callParent="hello()"></dctv2>
和scope:{callParent:'&'}
$scope.$emit
在dctv2
后来所有父范围会听到该消息.现在我想dctv1
谈谈dctv2
.
$scope.$broadcast
,但所有孩子都会听到.通过这里谈话,我的意思是称为函数或类似函数.不想设置堵塞digestloop的手表.
如何以最佳方式进行dctv1
通知dctv2
,使它们松散耦合?我应该能够删除dctv2而不会出错.
看看这个例子:
import matplotlib.pyplot as plt
l = [3,3,3,2,1,4,4,5,5,5,5,5,5,5,5,5]
plt.hist(l,normed=True)
plt.show()
Run Code Online (Sandbox Code Playgroud)
输出以图片形式发布.我有两个问题:
a)为什么只有4和5个箱子以其价值为中心?其他人不应该这样吗?是否有诀窍让他们居中?
b)为什么垃圾箱没有按比例标准化?我希望所有箱子的y值总和为1.
请注意,我的真实示例在列表中包含更多值,但它们都是离散的.
编辑:
我真正想要做的是找到局部最大值,这在下面解释得很好,同样的解决方案也在这里解释:
http://scikit-image.org/docs/dev/auto_examples/plot_peak_local_max.html
看来你可以在Numpy 做线性卷积.
是否可以进行非线性最大池化卷积?使用NxM补丁并跨越输入图像,如果当前像素不是附近的最大像素,则归零?
所以非线性最大卷积就像这样,这是我的形象
3 4 5 2 3
3 5 1 2 7
2 2 5 1 7
Run Code Online (Sandbox Code Playgroud)
给定2x2最大池值给出此输出
0 0 5 0 0
0 5 0 0 7
0 0 5 0 7
Run Code Online (Sandbox Code Playgroud)
你有一个2x2补丁跨越图像,并将所有内容归零,只保留最大值.
给定一个查询,我有一个文档的余弦分数.我也有文件pagerank.是否有标准的好方法将两者结合起来?
我在考虑增加它们
Total_Score = cosine-score * pagerank
Run Code Online (Sandbox Code Playgroud)
因为如果你在pagerank或cosine-score上得到低分,那么文档就不那么有趣了.
或者最好是加权和?
Total_Score = weight1 * cosine-score + weight2 * pagerank
Run Code Online (Sandbox Code Playgroud)
这是否更好?然后你可能有零余弦分数,但是高分页,并且页面将显示在结果中.
python ×5
javascript ×2
numpy ×2
scikit-learn ×2
angularjs ×1
css ×1
java ×1
jquery ×1
matplotlib ×1
position ×1
search ×1
string ×1
tf-idf ×1