小编bmc*_*bmc的帖子

ggplot2 - 将数字轴标题更改为字符串向量

到目前为止,我的 ggplot 编译有以下内容:

在此处输入图片说明

这次我得到了恰到好处的轴......使用以下代码片段:

p<- p + ylim(c(0,100))
p<- p + geom_hline(aes(yintercept=0))

p<- p + scale_x_continuous(breaks = c(seq(1940,1985,by=5)))
p
Run Code Online (Sandbox Code Playgroud)

所以我有一个从 1940 年到 1985 年以 5 为步长x 轴和一个从 0-100 以 20 为步长y 轴......

第一个问题

如何使 100 出现在 y 轴上?

第二个问题

如何将我的 x 标签更改为以下字符串向量?

abbrev_x <- c("1940","'45","'50","'55","'60","'65","'70","'75","'80","'85")
abbrev_y <- c("0","20","40","60","80","100%")
Run Code Online (Sandbox Code Playgroud)

因此,我发现的最佳解决方案是围绕scale_x_continuous,以下代码片段示例建议使用已经存在的字符串轴标签:

p + scale_x_discrete(limit = c("I1", "SI2", "SI1"),
                 labels = c("Ione","SItwo","SIone"))
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

这当然是一个问题,因为我想写的是以下内容:

abbrev_x <- c("1940","'45","'50","'55","'60","'65","'70","'75","'80","'85")
abbrev_y <- c("0","20","40","60","80","100%")
p<- p + scale_x_continuous(breaks …
Run Code Online (Sandbox Code Playgroud)

string label axis r ggplot2

5
推荐指数
1
解决办法
3378
查看次数

mongo shell - 访问数据库集合

问题

我已经mongo在我的 MAC OSX 环境中成功启动了shell。我正在为以下链接和文档提供资源,以找出进入数据库,然后是集合,然后查询集合中的文档的简单任务: 从 MongoDB 文档访问数据库访问集合和文档,在 Stackoverflow 上,以及访问Tutorials Point的合集

我通过PyMongoAPI创建并加载了数据库。这成功地创建了一个名为 的数据库UCI-Database,一个名为的集合income,并用来自.csv文档的一堆文档(行)填充它。

迄今为止 ..

这是我的结果...

Blakes-MacBook-Pro:nosql bmc$ mongo 127.0.0.1:27017
MongoDB shell version v3.4.4
connecting to: 127.0.0.1:27017
MongoDB server version: 3.4.4
Server has startup warnings: 
2017-05-16T12:22:10.147-0400 I CONTROL  [initandlisten] 
2017-05-16T12:22:10.147-0400 I CONTROL  [initandlisten] ** WARNING: Access control is not enabled for the database.
2017-05-16T12:22:10.147-0400 I CONTROL  [initandlisten] **          Read and write …
Run Code Online (Sandbox Code Playgroud)

mongodb

3
推荐指数
1
解决办法
6546
查看次数

sklearn - 预测每个班级的概率

到目前为止,我已经为另一个帖子sklearn文档提供了资源

所以一般来说我想生成以下示例:

X = np.matrix([[1,2],[2,3],[3,4],[4,5]])
y = np.array(['A', 'B', 'B', 'C', 'D'])
Xt = np.matrix([[11,22],[22,33],[33,44],[44,55]])
model = model.fit(X, y)
pred = model.predict(Xt)
Run Code Online (Sandbox Code Playgroud)

但是对于输出,我希望每个观察看到3列作为输出pred:

 A  |  B  |  C
.5  | .2  | .3
.25 | .25 | .5
...
Run Code Online (Sandbox Code Playgroud)

每个班级出现在我的预测中的概率不同.

我相信最好的方法是Multilabel classification从我上面提供的第二个链接.另外,我认为跳入下面列出的一个multi-label或多个multi-output模型可能是一个好主意:

Support multilabel:

    sklearn.tree.DecisionTreeClassifier
    sklearn.tree.ExtraTreeClassifier
    sklearn.ensemble.ExtraTreesClassifier
    sklearn.neighbors.KNeighborsClassifier
    sklearn.neural_network.MLPClassifier
    sklearn.neighbors.RadiusNeighborsClassifier
    sklearn.ensemble.RandomForestClassifier
    sklearn.linear_model.RidgeClassifierCV

Support multiclass-multioutput:

    sklearn.tree.DecisionTreeClassifier
    sklearn.tree.ExtraTreeClassifier
    sklearn.ensemble.ExtraTreesClassifier
    sklearn.neighbors.KNeighborsClassifier
    sklearn.neighbors.RadiusNeighborsClassifier
    sklearn.ensemble.RandomForestClassifier
Run Code Online (Sandbox Code Playgroud)

但是,我正在寻找能够以正确的方式做到这一点的人更有信心和经验的人.所有反馈都表示赞赏.

-bmc

machine-learning probability multilabel-classification predictive

1
推荐指数
1
解决办法
4112
查看次数