到目前为止,我的 ggplot 编译有以下内容:
这次我得到了恰到好处的轴......使用以下代码片段:
p<- p + ylim(c(0,100))
p<- p + geom_hline(aes(yintercept=0))
p<- p + scale_x_continuous(breaks = c(seq(1940,1985,by=5)))
p
Run Code Online (Sandbox Code Playgroud)
所以我有一个从 1940 年到 1985 年以 5 为步长的x 轴和一个从 0-100 以 20 为步长的y 轴......
如何使 100 出现在 y 轴上?
如何将我的 x 标签更改为以下字符串向量?
abbrev_x <- c("1940","'45","'50","'55","'60","'65","'70","'75","'80","'85")
abbrev_y <- c("0","20","40","60","80","100%")
Run Code Online (Sandbox Code Playgroud)
因此,我发现的最佳解决方案是围绕scale_x_continuous,以下代码片段示例建议使用已经存在的字符串轴标签:
p + scale_x_discrete(limit = c("I1", "SI2", "SI1"),
labels = c("Ione","SItwo","SIone"))
Run Code Online (Sandbox Code Playgroud)
这当然是一个问题,因为我想写的是以下内容:
abbrev_x <- c("1940","'45","'50","'55","'60","'65","'70","'75","'80","'85")
abbrev_y <- c("0","20","40","60","80","100%")
p<- p + scale_x_continuous(breaks …Run Code Online (Sandbox Code Playgroud) 我已经mongo在我的 MAC OSX 环境中成功启动了shell。我正在为以下链接和文档提供资源,以找出进入数据库,然后是集合,然后查询集合中的文档的简单任务:
从 MongoDB 文档访问数据库,
访问集合和文档,在 Stackoverflow 上,以及访问Tutorials Point的合集。
我通过PyMongoAPI创建并加载了数据库。这成功地创建了一个名为 的数据库UCI-Database,一个名为的集合income,并用来自.csv文档的一堆文档(行)填充它。
这是我的结果...
Blakes-MacBook-Pro:nosql bmc$ mongo 127.0.0.1:27017
MongoDB shell version v3.4.4
connecting to: 127.0.0.1:27017
MongoDB server version: 3.4.4
Server has startup warnings:
2017-05-16T12:22:10.147-0400 I CONTROL [initandlisten]
2017-05-16T12:22:10.147-0400 I CONTROL [initandlisten] ** WARNING: Access control is not enabled for the database.
2017-05-16T12:22:10.147-0400 I CONTROL [initandlisten] ** Read and write …Run Code Online (Sandbox Code Playgroud) 到目前为止,我已经为另一个帖子和sklearn文档提供了资源
所以一般来说我想生成以下示例:
X = np.matrix([[1,2],[2,3],[3,4],[4,5]])
y = np.array(['A', 'B', 'B', 'C', 'D'])
Xt = np.matrix([[11,22],[22,33],[33,44],[44,55]])
model = model.fit(X, y)
pred = model.predict(Xt)
Run Code Online (Sandbox Code Playgroud)
但是对于输出,我希望每个观察看到3列作为输出pred:
A | B | C
.5 | .2 | .3
.25 | .25 | .5
...
Run Code Online (Sandbox Code Playgroud)
每个班级出现在我的预测中的概率不同.
我相信最好的方法是Multilabel classification从我上面提供的第二个链接.另外,我认为跳入下面列出的一个multi-label或多个multi-output模型可能是一个好主意:
Support multilabel:
sklearn.tree.DecisionTreeClassifier
sklearn.tree.ExtraTreeClassifier
sklearn.ensemble.ExtraTreesClassifier
sklearn.neighbors.KNeighborsClassifier
sklearn.neural_network.MLPClassifier
sklearn.neighbors.RadiusNeighborsClassifier
sklearn.ensemble.RandomForestClassifier
sklearn.linear_model.RidgeClassifierCV
Support multiclass-multioutput:
sklearn.tree.DecisionTreeClassifier
sklearn.tree.ExtraTreeClassifier
sklearn.ensemble.ExtraTreesClassifier
sklearn.neighbors.KNeighborsClassifier
sklearn.neighbors.RadiusNeighborsClassifier
sklearn.ensemble.RandomForestClassifier
Run Code Online (Sandbox Code Playgroud)
但是,我正在寻找能够以正确的方式做到这一点的人更有信心和经验的人.所有反馈都表示赞赏.
-bmc
machine-learning probability multilabel-classification predictive