如何测量python函数的速度

我通常在www.codefights.com上编写代码(函数)作为竞争对手.因此速度是代码的重要部分之一.我怎样才能测量python语言中某个代码的速度,无论是lambda函数还是def函数.

python performance performance-measuring

Sye*_*aan

lucky-day

10
推荐指数

3
解决办法

8411
查看次数

为什么scikit学习混淆矩阵是相反的？

我有3个问题：

sklearn的混淆矩阵如下：

TN | FP
FN | TP

Run Code Online (Sandbox Code Playgroud)

当我查看在线资源时，我发现它是这样的：

TP | FP
FN | TN

Run Code Online (Sandbox Code Playgroud)

我应该考虑哪一个？

由于上述 scikit learn 的混淆矩阵与我在其他资源中找到的混淆矩阵不同，在多类混淆矩阵中，结构是什么？我正在看这篇文章： Scikit-learn：如何获得真阳性、真阴性、假阳性和假阴性在那篇文章中，@lucidv01d 发布了一个图表来了解多类的类别。scikit learn 中的那个类别是否相同？

你如何计算多类的准确性？例如，我有这个混淆矩阵：

[[27  6  0 16]
 [ 5 18  0 21]
 [ 1  3  6  9]
 [ 0  0  0 48]]

Run Code Online (Sandbox Code Playgroud)

在我在问题 2 中提到的同一篇文章中，他写下了这个等式：

整体准确度

ACC = (TP+TN)/(TP+FP+FN+TN)

但这不只是二进制吗？我的意思是，我用什么班级代替TP？

confusion-matrix scikit-learn text-classification performance-measuring

Joh*_*all

lucky-day

5
推荐指数

2
解决办法

2780
查看次数

在 Apache Spark Logistic 回归算法中获得相同的精度、召回率和 F 分数值

我已经为分类问题实现了逻辑回归。我在精度、召回率和 F1 分数上得到相同的值。具有相同的值可以吗？我在实现决策树和随机森林时也遇到了这个问题。在那里我也得到了相同的精度、召回率和 F1 分数。

// Run training algorithm to build the model.
        final LogisticRegressionModel model = new LogisticRegressionWithLBFGS()
                .setNumClasses(13).
                run(data.rdd());
//Compute raw scores on the test set.
        JavaRDD<Tuple2<Object, Object>> predictionAndLabels = testData.map(
                new Function<LabeledPoint, Tuple2<Object, Object>>() {
                    public Tuple2<Object, Object> call(LabeledPoint p) {
                        Double prediction = model.predict(p.features());
                        return new Tuple2<Object, Object>(prediction, p.label());
                    }
                }
        );
// Get evaluation metrics.
        MulticlassMetrics metrics = new MulticlassMetrics(predictionAndLabels.rdd());
        double precision = metrics.precision();
        System.out.println("Precision = " + precision);

        double recall = metrics.recall();
        System.out.println("Recall = …

Run Code Online (Sandbox Code Playgroud)

apache-spark performance-measuring

Tha*_*ana

lucky-day

4
推荐指数

1
解决办法

6982
查看次数

使用 mlr-package 构建模型时的自定义性能度量

我刚刚针对我目前正在处理的特定问题进行了从caret到的切换mlr。我想知道这里是否有人熟悉在resample()函数中指定自定义性能度量。

这是一个可重现的代码示例：

library(mlr)
library(mlbench)

data(BostonHousing, package = "mlbench")

task_reg1  <- makeRegrTask(id = "bh", data = BostonHousing, target = "medv")
lrn_reg1   <- makeLearner(cl = "regr.randomForest",
                        predict.type = "response",
                        mtry=3) 
cv_reg1 <- makeResampleDesc("RepCV", folds = 5, reps = 5)

regr_1 <- resample(learner = lrn_reg1,
                     task = task_reg1,
                     resampling = cv_reg1,
                     measures = mlr::rmse)

Run Code Online (Sandbox Code Playgroud)

我想计算平均绝对比例误差，而不是计算 RMSE 。例如，可以在Metrics包中找到用于此的函数：Metrics::mase()。

我试图measures = Metrics::mase直接包含在resample()调用中，但正如预期的那样，有点乐观，我收到以下错误： Error in checkMeasures(measures, task) : Assertion on …

r function machine-learning mlr performance-measuring

veg*_*tvd

2020 04-27

2
推荐指数

1
解决办法

105
查看次数