小编Mah*_*lid的帖子

R:我们如何打印SVM的百分比准确度

这是我的示例R代码:

    train <- read.csv("Train.csv")
    test <- read.csv("Test+.csv")

   x <- model.matrix(age ~ . - 1,data=train)           

    classify=svm(as.factor(age)~ ., data=train,method="class")
    pred = predict(classify,test,type="class")

Run Code Online (Sandbox Code Playgroud)

我怎样才能从中打印百分比准确度？我希望显示所有性能指标,如准确度,精度,召回.etc以供我评估.

r machine-learning svm libsvm confusion-matrix

Mah*_*lid

2016 03-30

5
推荐指数

1
解决办法

8226
查看次数

R 中多类分类的 ROC 曲线

我有一个包含 6 个类别的数据集，我想绘制多类别分类的 ROC 曲线。Achim Zeileis 给出的第一个答案非常好。

R中使用rpart包的ROC曲线？

但这仅适用于二项式分类。我得到的错误是Error in prediction, Number of classes is not equal to 2。有人做过多类分类吗？

这是我正在尝试做的一个简单的例子。数据 <- read.csv("colors.csv")

假设data$cType值6（或级别）为（红色、绿色、蓝色、黄色、黑色和白色）

有没有办法为这 6 个类别绘制 ROC 曲线？任何超过 2 类的工作示例将不胜感激。

r classification machine-learning roc

Mah*_*lid

2017 05-23

5
推荐指数

1
解决办法

6093
查看次数

将数据分区创建为训练，测试和验证-在R中拆分

我想将训练数据分为70％训练，15％测试和15％验证。我正在使用createDataPartition()插入符号包的功能。我将其拆分如下

train <- read.csv("Train.csv")
test <- read.csv("Test.csv")

split=0.70
trainIndex <- createDataPartition(train$age, p=split, list=FALSE)
data_train <- train[ trainIndex,]
data_test <- train[-trainIndex,]

Run Code Online (Sandbox Code Playgroud)

是否有任何方法可以createDataPartition()像以下H2o方法一样分为训练，测试和验证？

data.hex <- h2o.importFile("Train.csv")
splits <- h2o.splitFrame(data.hex, c(0.7,0.15), destination_frames = c("train","valid","test"))
train.hex <- splits[[1]]
valid.hex <- splits[[2]]
test.hex  <- splits[[3]]

Run Code Online (Sandbox Code Playgroud)

r classification machine-learning r-caret

Mah*_*lid

2016 10-09

3
推荐指数

1
解决办法

1万
查看次数

python pandas中列的数组范围

我有一个三列数据集格式如下

    t_stamp,Xval,Ytval
    0.000543,0,10
    0.000575,0,10
    0.041324,1,10
    0.041331,2,10
    0.041336,3,10
    0.04134,4,10
    0.041345,5,10
    0.04135,6,10
    0.041354,7,10


df = pd.read_csv('test.csv')

Run Code Online (Sandbox Code Playgroud)

我想只运行前3行,我可以像下面这样做

for i in range(1,4):
    df['X_t'+str(i)] = df['X'].shift(i)
X = df[['X', 'X_t1', 'X_t2', 'X_t3']].values

Run Code Online (Sandbox Code Playgroud)

如果我想在5个范围内进行,我可以像下面这样做

for i in range(1,6):
        df['X_t'+str(i)] = df['X'].shift(i)
    X = df[['X', 'X_t1', 'X_t2', 'X_t3', 'X_t4', 'X_t5']].values

Run Code Online (Sandbox Code Playgroud)

但是,如果我们想要在更高的范围内运行它,则效率不高.我如何自动化,以便我们不必手动分配X的值,因为X = df[['X', 'X_t1', 'X_t2', 'X_t3']].values我们想要运行1000个范围？做X = df[['X', 'X_t1', 'X_t2', 'X_t3', 'X_t4', ..., 'X_1000']].values不高效.

python arrays numpy dataframe pandas

Mah*_*lid

2017 08-28

1
推荐指数

1
解决办法

122
查看次数