ggplot2 - 将数字轴标题更改为字符串向量

到目前为止，我的 ggplot 编译有以下内容：

这次我得到了恰到好处的轴......使用以下代码片段：

p<- p + ylim(c(0,100))
p<- p + geom_hline(aes(yintercept=0))

p<- p + scale_x_continuous(breaks = c(seq(1940,1985,by=5)))
p

Run Code Online (Sandbox Code Playgroud)

所以我有一个从 1940 年到 1985 年以 5 为步长的x 轴和一个从 0-100 以 20 为步长的y 轴......

第一个问题

如何使 100 出现在 y 轴上？

第二个问题

如何将我的 x 标签更改为以下字符串向量？

abbrev_x <- c("1940","'45","'50","'55","'60","'65","'70","'75","'80","'85")
abbrev_y <- c("0","20","40","60","80","100%")

Run Code Online (Sandbox Code Playgroud)

因此，我发现的最佳解决方案是围绕scale_x_continuous，以下代码片段示例建议使用已经存在的字符串轴标签：

p + scale_x_discrete(limit = c("I1", "SI2", "SI1"),
                 labels = c("Ione","SItwo","SIone"))

Run Code Online (Sandbox Code Playgroud)

这当然是一个问题，因为我想写的是以下内容：

abbrev_x <- c("1940","'45","'50","'55","'60","'65","'70","'75","'80","'85")
abbrev_y <- c("0","20","40","60","80","100%")
p<- p + scale_x_continuous(breaks …

Run Code Online (Sandbox Code Playgroud)

string label axis r ggplot2

bmc*_*bmc

2020 06-20

5
推荐指数

1
解决办法

3378
查看次数

mongo shell - 访问数据库集合

问题

我已经mongo在我的 MAC OSX 环境中成功启动了shell。我正在为以下链接和文档提供资源，以找出进入数据库，然后是集合，然后查询集合中的文档的简单任务：从 MongoDB 文档访问数据库，访问集合和文档，在 Stackoverflow 上，以及访问Tutorials Point的合集。

我通过PyMongoAPI创建并加载了数据库。这成功地创建了一个名为的数据库UCI-Database，一个名为的集合income，并用来自.csv文档的一堆文档（行）填充它。

迄今为止 ..

这是我的结果...

Blakes-MacBook-Pro:nosql bmc$ mongo 127.0.0.1:27017
MongoDB shell version v3.4.4
connecting to: 127.0.0.1:27017
MongoDB server version: 3.4.4
Server has startup warnings: 
2017-05-16T12:22:10.147-0400 I CONTROL  [initandlisten] 
2017-05-16T12:22:10.147-0400 I CONTROL  [initandlisten] ** WARNING: Access control is not enabled for the database.
2017-05-16T12:22:10.147-0400 I CONTROL  [initandlisten] **          Read and write …

Run Code Online (Sandbox Code Playgroud)

mongodb

bmc*_*bmc

2017 06-24

3
推荐指数

1
解决办法

6546
查看次数

sklearn - 预测每个班级的概率

到目前为止,我已经为另一个帖子和sklearn文档提供了资源

所以一般来说我想生成以下示例:

X = np.matrix([[1,2],[2,3],[3,4],[4,5]])
y = np.array(['A', 'B', 'B', 'C', 'D'])
Xt = np.matrix([[11,22],[22,33],[33,44],[44,55]])
model = model.fit(X, y)
pred = model.predict(Xt)

Run Code Online (Sandbox Code Playgroud)

但是对于输出,我希望每个观察看到3列作为输出pred:

 A  |  B  |  C
.5  | .2  | .3
.25 | .25 | .5
...

Run Code Online (Sandbox Code Playgroud)

每个班级出现在我的预测中的概率不同.

我相信最好的方法是Multilabel classification从我上面提供的第二个链接.另外,我认为跳入下面列出的一个multi-label或多个multi-output模型可能是一个好主意:

Support multilabel:

    sklearn.tree.DecisionTreeClassifier
    sklearn.tree.ExtraTreeClassifier
    sklearn.ensemble.ExtraTreesClassifier
    sklearn.neighbors.KNeighborsClassifier
    sklearn.neural_network.MLPClassifier
    sklearn.neighbors.RadiusNeighborsClassifier
    sklearn.ensemble.RandomForestClassifier
    sklearn.linear_model.RidgeClassifierCV

Support multiclass-multioutput:

    sklearn.tree.DecisionTreeClassifier
    sklearn.tree.ExtraTreeClassifier
    sklearn.ensemble.ExtraTreesClassifier
    sklearn.neighbors.KNeighborsClassifier
    sklearn.neighbors.RadiusNeighborsClassifier
    sklearn.ensemble.RandomForestClassifier

Run Code Online (Sandbox Code Playgroud)

但是,我正在寻找能够以正确的方式做到这一点的人更有信心和经验的人.所有反馈都表示赞赏.

-bmc

machine-learning probability multilabel-classification predictive

bmc*_*bmc

lucky-day

1
推荐指数

1
解决办法

4112
查看次数