标签: feature-extraction

我正在使用dlib的face_landmark_detection_ex.cpp,它在原始图像上显示检测到的面部图像和所有面部标记.我想将原始图像与所有68个面部地标保存到我的计算机上.我知道它可以通过dlib的save_png和draw_rectangle函数来完成,但draw_rectangle只给出检测到的面部矩形位置,同时我也想在原始图像上绘制标志点并保存它们如下:

c++ feature-extraction face-detection dlib

ANU*_*NGH

2016 04-28

6
推荐指数

1
解决办法

4869
查看次数

ValueError：修剪后，没有剩余项。尝试较低的 min_df 或较高的 max_df

from sklearn.feature_extraction.text import TfidfVectorizer
tfidf_vectorizer = TfidfVectorizer(max_df=0.95, max_features=200000,
                             min_df=.5, stop_words='english',
                             use_idf=True,sublinear_tf=True,tokenizer = tokenize_and_stem_body,ngram_range=(1,3))
tfidf_matrix_body = tfidf_vectorizer.fit_transform(totalvocab_stemmed_body)

Run Code Online (Sandbox Code Playgroud)

上面的代码给了我错误

ValueError: After pruning, no terms remain. Try a lower min_df or a higher max_df.

Run Code Online (Sandbox Code Playgroud)

任何人都可以帮助我解决相同的问题，并且我已将所有值 80 更改为 100 但问题仍然相同吗？

python feature-extraction tf-idf scikit-learn

Jee*_*ich

2016 06-15

6
推荐指数

1
解决办法

8901
查看次数

如何使用python处理测试数据集中看不见的分类值？

假设我有位置功能。在训练数据集中，它的唯一值是“NewYork”、“Chicago”。但在测试集中，它有“NewYork”、“Chicago”、“London”。那么在创建一种热编码时如何忽略“伦敦”？换句话说，如何不对只出现在测试集中的类别进行编码？

python machine-learning feature-extraction categorical-data one-hot-encoding

Neo*_*Neo

2017 01-19

6
推荐指数

1
解决办法

2906
查看次数

比较没有 SVM 的 HOG 特征向量

我是计算机视觉的新手，目前正在做一个关于形状检测的学习项目，其中我在最有可能存在对象的所有图像中都有一个固定的感兴趣区域（ROI），我必须比较它们的形状以确定是否两个输入图像中存在的物体是否相同。有轻微的平移和尺度变化以及光照变化。

我正在尝试比较两个输入图像之间对象的形状，并尝试提供描述它们相似性的输出值。如果相似度高于某个阈值，我可以判断出两个输入图像中都存在相同的对象。

我试过轮廓，但它没有给出可靠的结果（阈值要么给出太多细节要么错过了一些重要的细节）并且不能很好地概括到所有图像。我正在考虑使用像 HOG 这样的全局形状描述符。

但是我在理解 HOG 描述符中的特征向量值时遇到了问题。如何在不使用 SVM 或机器学习的情况下比较两个输入图像的 HOG 特征向量（1D）以找到相似性？比较 HOG 特征向量的最佳方法是什么？

我不明白距离度量如何用于比较未来向量。我想了解如何使用距离来比较特征向量和直方图的物理意义？如何使用它们来比较 HOG 特征向量？

python opencv distance feature-extraction feature-descriptor

Sak*_*eek

2017 12-18

6
推荐指数

1
解决办法

2291
查看次数

可视化时间序列序列的 1D CNN 特征重要性

我正在尝试从我的 1D CNN 中提取特征重要性。大多数在线文档都涉及 2D、3D、图像数据和分类问题。我有一个输出时间序列序列的多元时间序列。我尝试过 Shaply 和 keras_vis，但没有解决我的问题。一个问题是我的输入数据有 229 个特征，1DConv 的第一层映射了 64 个过滤器。从第一层提取权重，我可以确定哪个过滤器有助于该层的学习。但是，我无法将其转换为原始输出。

我的问题是双重的（如果我能同时做到）：

鉴于第一层的权重，我如何可视化特定过滤器的显着性？
如何提取重要特征；鉴于我的具体问题和拱。？

这是用于提取权重的摘要和代码....

Model: "model_3"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
==================================================================================================
CNN1-Input-Historical (InputLay [(None, 10, 229)]    0                                            
__________________________________________________________________________________________________
CNN1-Conv1D (Conv1D)            (None, 7, 64)        58688       CNN1-Input-Historical[0][0]      
__________________________________________________________________________________________________
conv1d_3 (Conv1D)               (None, 3, 128)       24704       CNN1-Conv1D[0][0]                
__________________________________________________________________________________________________
CNN1-MaxPooling (MaxPooling1D)  (None, 2, 128)       0           conv1d_3[0][0]                   
__________________________________________________________________________________________________
CNN1-Flatten (Flatten)          (None, 256)          0           CNN1-MaxPooling[0][0]            
__________________________________________________________________________________________________
dense_9 (Dense)                 (None, 50)           12850       CNN1-Flatten[0][0]               
__________________________________________________________________________________________________
dense_10 (Dense)                (None, 50)           2550        dense_9[0][0] …

Run Code Online (Sandbox Code Playgroud)

python time-series feature-extraction conv-neural-network keras

Al *_*irk

2020 02-01

6
推荐指数

0
解决办法

448
查看次数