标签: classification

使用分类器更改工件的maven依赖关系

使用maven jar插件,我构建了两个jar:bar-1.0.0.jar和bar-1.0.0-client.jar.

实际上在我的POM中我有以下依赖:

<dependency>   
   <groupId>de.app.test</groupId>
   <artifactId>foo</artifactId>
   <version>1.0.0</version>
</dependency>
Run Code Online (Sandbox Code Playgroud)

此工件也存在于两个版本bar-1.0.0.jar和bar-1.0.0-client.jar中

我想使bar-1.0.0-client.jar依赖于foo-1.0.0-client.jar和bar-1.0.0.jar依赖于foo-1.0.0.jar.

================

- >第一个(错误的)解决方案:定义提供的范围,并在使用bar.jar时使用正确的foo包

- >第二个(长)解决方案:将"服务器"分类器添加到另一个jar中.使用不同的配置文件来构建foo工件并将分类器放在属性中.

<dependency>
    <groupId>de.app.test</groupId>
    <artifactId>foo</artifactId>
    <version>1.0.0</version>
    <classifier>${profile.classifier}<classifier>
</dependency>
Run Code Online (Sandbox Code Playgroud)

================
关于配置文件解决方案.

接口模块pom

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/maven-v4_0_0.xsd">
    <parent>
        <groupId>com.app</groupId>
        <artifactId>myapp-parent</artifactId>
        <version>1.1.0</version>
    </parent>
    <modelVersion>4.0.0</modelVersion>
    <groupId>com.app</groupId>
    <artifactId>myapp-interfaces</artifactId>
    <version>1.1.0-SNAPSHOT</version>
    <packaging>jar</packaging>
    <name>myapp Interfaces</name>
    <profiles>
        <profile>
            <id>server</id>
            <activation>
                <activeByDefault>true</activeByDefault>
            </activation>
            <build>
                <plugins>
                    <plugin>
                        <artifactId>maven-jar-plugin</artifactId>
                        <executions>
                            <execution>
                                <id>jar-server</id>
                                <phase>package</phase>
                                <goals>
                                    <goal>jar</goal>
                                </goals>
                                <configuration>
                                    <classifier>server</classifier>
                                </configuration>
                            </execution>
                        </executions>
                    </plugin>
                </plugins>
            </build>
        </profile>
        <profile>
            <id>client</id>
            <activation>
                <activeByDefault>true</activeByDefault>
            </activation>
            <build>
                <plugins>
                    <plugin>
                        <artifactId>maven-jar-plugin</artifactId>
                        <executions>
                            <execution> …
Run Code Online (Sandbox Code Playgroud)

maven-2 classification dependency-management maven-plugin maven-jar-plugin

10
推荐指数
1
解决办法
2万
查看次数

人工智能与机器学习中的随机性

在AI和ML中处理2个项目时,我想到了这个问题.如果我正在构建模型(例如,分类神经网络,K-NN等等),该模型使用包含随机性的一些功能.如果我不修复种子,那么每次在相同的训练数据上运行算法时,我都会得到不同的精度结果.但是,如果我修复它,那么其他一些设置可能会提供更好的结果.

平均一组精度足以说明这个模型的准确度是xx%吗?

我不确定这是否是提出这样一个问题的正确场所/开放这样的讨论.

artificial-intelligence classification machine-learning data-mining

10
推荐指数
2
解决办法
1852
查看次数

为什么偏差项在岭回归中没有正则化?

在大多数分类(例如逻辑/线性回归)中,偏差项在正则化时被忽略.如果我们不规范偏见项,我们会得到更好的分类吗?

classification machine-learning

10
推荐指数
1
解决办法
5948
查看次数

文字分类方法?SVM和决策树

我有一套训练集,我想根据我的训练集使用分类方法对其他文件进行分类.我的文件类型是新闻,类别是体育,政治,经济等.

我完全理解天真的贝叶斯和KNN,但SVM和决策树是模糊的,我不知道我是否可以自己实现这个方法?或者有使用这种方法的应用程序?

我可以用这种方式对文档进行分类的最佳方法是什么?

谢谢!

classification svm

10
推荐指数
2
解决办法
8498
查看次数

10
推荐指数
2
解决办法
2万
查看次数

McNemar在Python中的测试和分类机器学习模型的比较

是否有一个很好的McNemar测试在Python中实现?我没有在Scipy.stats或Scikit-Learn中看到它.我可能忽略了其他一些好的套餐.请推荐.

McNemar的测试几乎是用于比较给定保持测试集的两种分类算法/模型的测试(不是通过K折叠或重采样方法来模拟测试集).两种常见的替代方案是:用于比较直接真实正比例p_Ap_B来自两种算法和模型的t检验,A以及B1)假设方差遵循二项分布或2)使用重复重采样序列和测试集来估计方差.

然而,后两者显示具有高的1型错误(声明模型在统计上不同但实质上它们是相同的).如果比较两种分类算法或模型,McNemar的测试仍被认为是最好的.见Dietterich10.

或者作为替代方案,如果不是通过McNemar的测试,人们如何在实践中统计比较两种分类模型?

python statistics classification machine-learning text-classification

10
推荐指数
0
解决办法
2482
查看次数

预测班级或班级概率?

我目前正在使用H2O作为分类问题数据集.我H2ORandomForestEstimator在python 3.6环境中测试它.我注意到预测方法的结果给出了0到1之间的值(我假设这是概率).

在我的数据集中,目标属性是数字,即True值为1,False值为0.我确保将类型转换为目标属性的类别,我仍然得到相同的结果.

然后我修改了代码,将目标列转换为asfactor()H2OFrame上的因子使用方法,结果没有任何变化.

但是当我将目标属性中的值分别更改为1和0时的True和False时,我得到了预期结果(即)输出是分类而不是概率.

  • 获得分类预测结果的正确方法是什么?
  • 如果概率是数值目标值的结果,那么在多类分类的情况下如何处理它?

python classification machine-learning random-forest h2o

10
推荐指数
2
解决办法
4171
查看次数

如何使用scikit交叉验证模块将数据(原始文本)拆分为测试/训练集?

我在原始文本中有大量的意见(2500).我想使用scikit-learn库将它们分成测试/训练集.用scikit-learn解决这个任务可能是最好的方法吗?任何人都可以给我一个在测试/训练集中拆分原始文本的例子(可能我会使用tf-idf表示).

classification machine-learning scikit-learn cross-validation text-classification

9
推荐指数
1
解决办法
1万
查看次数

随机森林的简单解释

我试图了解随机森林如何用简单的英语而不是数学来运作.谁能给我一个关于这个算法如何工作的非常简单的解释?

据我所知,我们提供功能和标签,而不告诉算法哪个功能应归类为哪个标签?因为我曾经做过基于概率的朴素贝叶斯,我们需要告诉哪个特征应该是哪个标签.我完全离开了吗?

如果我能得到任何非常简单的解释,我将非常感激.

algorithm classification random-forest

9
推荐指数
3
解决办法
6172
查看次数

重现Fisher线性判别图

许多书籍使用下图说明了Fisher线性判别分析的概念(这个特别来自模式识别和机器学习,第188页)

在此输入图像描述

我想知道如何用R(或任何其他语言)重现这个数字.下面粘贴的是我在R中的初始努力.我模拟两组数据并使用abline()函数绘制线性判别式.欢迎任何建议.

set.seed(2014)
library(MASS)
library(DiscriMiner) # For scatter matrices

# Simulate bivariate normal distribution with 2 classes
mu1 <- c(2, -4)
mu2 <- c(2, 6)
rho <- 0.8
s1 <- 1
s2 <- 3
Sigma <- matrix(c(s1^2, rho * s1 * s2, rho * s1 * s2, s2^2), byrow = TRUE, nrow = 2)
n <- 50
X1 <- mvrnorm(n, mu = mu1, Sigma = Sigma)
X2 <- mvrnorm(n, mu = mu2, Sigma = Sigma)
y …
Run Code Online (Sandbox Code Playgroud)

statistics r classification machine-learning ggplot2

9
推荐指数
1
解决办法
1602
查看次数