对于Weka Explorer(GUI),当我们为任何给定的ARFF文件执行10倍的CV时,Weka Explorer提供的内容(据我所见)是所有10个折叠的平均结果.
问:有没有办法得到每个折叠的结果?例如,我需要每个折叠的错误率(错误识别的实例).
帮助赞赏.
在Weka的资源管理器的情况下,有没有办法让测试实例的类概率被Naive Bayes的分类器分类?
希望你能帮助我.我是蟒蛇和熊猫的新手,所以请耐心等待.我试图找到三个数据框之间的常用词,我正在使用Jupiter Notebook.
仅举例如:
df1=
A
dog
cat
cow
duck
snake
df2=
A
pig
snail
bird
dog
df3=
A
eagle
dog
snail
monkey
Run Code Online (Sandbox Code Playgroud)
在所有数据框中只有一列是A.我想找到1.所有列中的常用词2.对于它们自己的列而言并不共同的词.例; duck是df1独有的,snail是df2独有的,而monkey是df3独有的.我正在使用以下代码进行一些使用,但没有得到我想要的简单,
df1[df1['A'].isin(df2['A']) & (df2['A']) & (df3['A'])]
Run Code Online (Sandbox Code Playgroud)
请告诉我哪里出错了.干杯
我正在使用Weka Java API,我有一段代码.在代码中,我试图做如下的事情:
for (each instance i in the training/test set)
if (condition == TRUE)
remove instance (i) from training/test set;
Run Code Online (Sandbox Code Playgroud)
[编辑]例如,我有1000个实例,我试图查看每个实例,如果满足特定条件.如果条件为真,那么我将从训练/测试集中删除该实例.
我相信Weka没有以这种方式直接删除实例的选项.任何建议,专业人士?
我试图使用以下代码查看Web URL的内容类型.
有趣的是,给定URL(http://www.jbssinc.com/inv_pr_pdf/2007-05-08.pdf")的内容类型返回为text/html; charset=iso-8859-1即使它是PDF文档也会.我想了解原因.
这是我的代码:
public static void main(String[] args) throws MalformedURLException{
URLConnection urlConnection = null;
URL url = new URL("http://www.jbssinc.com/inv_pr_pdf/2007-05-08.pdf");
try {
urlConnection = url.openConnection();
urlConnection.setConnectTimeout(10*1000);
urlConnection.setReadTimeout(10*1000);
urlConnection.connect();
} catch (IOException e) {
System.out.println("Error in establishing connection.\n");
}
String contentType = "";
/* If we were able to get a connection ---> */
if (urlConnection != null) {
contentType = urlConnection.getContentType();
}
System.out.println(contentType);
}
Run Code Online (Sandbox Code Playgroud) weka ×3
java ×2
content-type ×1
instance ×1
intersection ×1
mime-types ×1
pandas ×1
python ×1
series ×1
string ×1
url ×1
web-crawler ×1