标签: classification

低延迟生产环境中的梯度提升预测?

任何人都可以建议使用<10-15ms范围内的梯度增强模型进行预测的策略(越快越好)?

我一直在使用Rgbm软件包,但第一次预测需要大约50ms(后续的矢量化预测平均为1ms,所以似乎有开销,可能在调用C++库时).作为指导,将有约10-50个输入和~50-500棵树.任务是分类,我需要访问预测的概率.

我知道那里有很多图书馆,但即使在粗略的预测时间内,我也很难找到信息.训练将在线下进行,因此只有预测需要很快 - 而且,预测可能来自一段完全独立于培训的代码/库(只要有一种表示树的通用格式) .

classification machine-learning

7
推荐指数
1
解决办法
2655
查看次数

朴素贝叶斯:培训的每个特征的内部差异必须是积极的

试图适应朴素贝叶斯时:

    training_data = sample; % 
    target_class = K8;
 # train model
 nb = NaiveBayes.fit(training_data, target_class);

 # prediction
 y = nb.predict(cluster3);
Run Code Online (Sandbox Code Playgroud)

我收到一个错误:

??? Error using ==> NaiveBayes.fit>gaussianFit at 535
The within-class variance in each feature of TRAINING
must be positive. The within-class variance in feature
2 5 6 in class normal. are not positive.

Error in ==> NaiveBayes.fit at 498
            obj = gaussianFit(obj, training, gindex);
Run Code Online (Sandbox Code Playgroud)

任何人都可以阐明这一点以及如何解决它?请注意,我在这里阅读了类似的帖子,但我不知道该怎么办?似乎它试图基于列而不是行来拟合,类方差应该基于属于特定类的每一行的概率.如果我删除那些列然后它可以工作,但显然这不是我想要做的.

matlab classification bayesian variance naivebayes

7
推荐指数
1
解决办法
6207
查看次数

使用SVM实时进行面部表情分类

我目前正在开展一个项目,我必须从悲伤或快乐中提取用户的面部表情(一次只能从网络摄像头一个用户).

我对面部表情进行分类的方法是:

  • 使用opencv检测图像中的面部
  • 使用ASM和stasm获取面部特征点

面部地标

现在我正在尝试做面部表情分类

SVM是个不错的选择吗?如果是我如何从SVM开始:

我将如何使用这个地标训练svm的每一个情绪?

opencv classification machine-learning svm libsvm

7
推荐指数
1
解决办法
1万
查看次数

如何对URL进行分类?什么是网址功能?如何从URL中选择和提取功能

我刚刚开始研究分类问题.它是一个两类问题,My Trained模型(机器学习)必须决定/预测允许URL或阻止它.

我的问题非常具体.

  1. 如何对URL进行分类?我应该使用普通的文本分析方法吗?
  2. 什么是网址功能?
  3. 如何从URL中选择和提取功能?

url classification machine-learning feature-extraction text-classification

7
推荐指数
1
解决办法
4908
查看次数

分类:使用sklearn进行PCA和逻辑回归

第0步:问题描述

我有一个分类问题,即我想基于数字特征的集合,使用逻辑回归和运行主成分分析(PCA)来预测二进制目标.

我有2个数据集:df_traindf_valid(分别是训练集和验证集)作为pandas数据框,包含特征和目标.作为第一步,我使用get_dummiespandas函数将所有分类变量转换为boolean.例如,我会:

n_train = 10
np.random.seed(0)
df_train = pd.DataFrame({"f1":np.random.random(n_train), \
                         "f2": np.random.random(n_train), \
                         "f3":np.random.randint(0,2,n_train).astype(bool),\
                         "target":np.random.randint(0,2,n_train).astype(bool)})

In [36]: df_train
Out[36]: 
         f1        f2     f3 target
0  0.548814  0.791725  False  False
1  0.715189  0.528895   True   True
2  0.602763  0.568045  False   True
3  0.544883  0.925597   True   True
4  0.423655  0.071036   True   True
5  0.645894  0.087129   True  False
6  0.437587  0.020218   True   True
7  0.891773  0.832620   True  False
8  0.963663  0.778157  False  False
9  0.383442  0.870012   True   True …
Run Code Online (Sandbox Code Playgroud)

python classification pca scikit-learn logistic-regression

7
推荐指数
1
解决办法
4553
查看次数

随机梯度下降是分类器还是优化器?

我是机器学习的新手,我正在尝试分析我的一个项目的分类算法。我SGDClassifiersklearn图书馆遇到的。但是很多论文都将 SGD 称为一种优化技术。有人可以解释一下是如何SGDClassifier实施的吗?

classification machine-learning gradient-descent scikit-learn

7
推荐指数
1
解决办法
1万
查看次数

二元分类使用哪种强化算法

我是机器学习的新手,但在过去的两天里我读了很多关于强化学习的内容。我有一个获取项目列表的应用程序(例如从 Upwork)。有一个主持人可以手动接受或拒绝项目(基于下面解释的一些参数)。如果项目被接受,我想发送项目提案,如果被拒绝,我将忽略它。我希望用人工智能取代该主持人(以及其他原因),所以我想知道我应该使用哪种强化算法。

参数:下面列出了一些决定代理是否接受或拒绝项目的参数。假设我只想接受与 Web 开发相关的项目(特别是后端/服务器端),这里是参数应如何影响代理。

  • 行业:如果项目与IT行业相关,那么被接受的机会应该更大。
  • 类别:如果项目属于 Web 开发类别,那么它应该有更多的机会被接受。
  • 雇主评级:评级超过 4 分(满分 5 分)的雇主应该有更多的机会被接受。

我认为 Q-Learning 或 SARSA 能够帮助我,但我看到的大多数例子都与悬崖行走问题有关,其中各州相互依赖,这不适用于我的情况,因为每个项目都不同于前一个。

注意:我希望代理能够自学,这样如果将来我也开始奖励它前端项目,它应该学习这种行为。因此,提出“纯粹的”监督学习算法是行不通的。

编辑 1:我想补充一点,我有 3000 个项目的数据(部门、类别、标题、雇主评级等)以及该项目是否被我的主持人接受或拒绝。

classification machine-learning reinforcement-learning

7
推荐指数
1
解决办法
2467
查看次数

新形状和旧形状必须具有相同数量的元素

出于学习目的,我正在使用Tensorflow.js,并且在尝试将该fit方法与批处理数据集(10 x 10)一起使用时遇到错误,以了解批处理培训的过程.

我有一些想要分类的图像600x600x3(2个输出,1或0)

这是我的训练循环:

  const batches = await loadDataset()

  for (let i = 0; i < batches.length; i++) {
    const batch = batches[i]
    const xs = batch.xs.reshape([batch.size, 600, 600, 3])
    const ys = tf.oneHot(batch.ys, 2)

    console.log({
      xs: xs.shape,
      ys: ys.shape,
    })
    // { xs: [ 10, 600, 600, 3 ], ys: [ 10, 2 ] }

    const history = await model.fit(
      xs, ys,
      {
        batchSize: batch.size,
        epochs: 1
      }) // <----- The code throws here

    const loss …
Run Code Online (Sandbox Code Playgroud)

javascript classification machine-learning tensorflow tensorflow.js

7
推荐指数
1
解决办法
337
查看次数

导入 BERT 时出错:模块“tensorflow._api.v2.train”没有属性“Optimizer”

我尝试在Google Colab中使用bert-tensorflow,但出现以下错误:

-------------------------------------------------- ------------------------- AttributeError Traceback(最近一次调用最后一次) in () 1 import bert ----> 2 from bert import run_classifier_with_tfhub # run_classifier 3 来自 bert 导入优化 4 来自 bert 导入标记化

1 帧 /usr/local/lib/python3.6/dist-packages/bert/optimization.py in () 85 86 ---> 87 class AdamWeightDecayOptimizer(tf.train.Optimizer): 88 """一个基本的 Adam 优化器其中包括“正确的”L2 权重衰减。""" 89

AttributeError:模块“tensorflow._api.v2.train”没有属性“Optimizer”

这是我尝试过的代码:

  1. 安装库:

!pip install --upgrade --force-reinstall tensorflow !pip install --upgrade --force-reinstall tensorflow-gpu !pip install tensorflow_hub !pip install sentencepiece !pip install bert-tensorflow

  1. 运行这段代码:

from sklearn.model_selection import train_test_split import pandas as pd from datetime import …

python classification tensorflow bert-language-model

7
推荐指数
1
解决办法
2万
查看次数

TypeError:无法为深度学习模型腌制弱引用对象

当我运行 pickle.dump(model,open('modelDL.pkl','wb')) 时,我收到 TypeError: can't pickle weakref objects。

我创建了一个深度学习模型,我正在尝试保存它。下面是模型。

model = Sequential()

model.add( Dense(30,activation='relu') )
model.add( Dropout(0.5) ) 
model.add( Dense(20,activation='relu') )
model.add( Dropout(0.5) ) 
model.add( Dense(20,activation='relu') )
model.add( Dropout(0.5) )     
model.add( Dense(1,activation='sigmoid') )

model.compile(optimizer='adam',loss='binary_crossentropy',metrics=['accuracy']) 
Run Code Online (Sandbox Code Playgroud)

classification python-3.x deep-learning tf.keras tensorflow2.0

7
推荐指数
1
解决办法
7442
查看次数