相关疑难解决方法(0)

使用libsvm功能的例子在Python中支持向量机

我已经抓了很多像这样的ebay游戏:

Apple iPhone 5 White 16GB Dual-Core

Run Code Online (Sandbox Code Playgroud)

我用这种方式手动标记了所有这些内容

B M C S NA

Run Code Online (Sandbox Code Playgroud)

其中B =品牌(Apple)M =型号(iPhone 5)C =颜色(白色)S =尺寸(尺寸)NA =未指定(双核)

现在我需要使用python中的libsvm库训练SVM分类器,以了解ebay标题中出现的序列模式.

我需要通过将问题视为分类来为该属性(品牌,模型,颜色,大小)提取新值.通过这种方式,我可以预测新模型.

我想考虑这个功能:

* Position
- from the beginning of the title
- to the end of the listing
* Orthographic features
- current word contains a digit
- current word is capitalized 
....

Run Code Online (Sandbox Code Playgroud)

我无法理解如何将所有这些信息提供给库.官方文档缺乏很多信息

我的班级是品牌,型号,尺寸,颜色,NA

SVM算法的输入文件必须包含什么？

我怎么创建它？考虑到我在问题中提供的4个功能,我可以举一个该文件的示例吗？我是否还可以使用一些示例来详细说明输入文件？

*更新* 我想代表这些功能......我该怎么办？

当前单词的身份

我想我可以用这种方式解释它

0 --> Brand
1 --> Model
2 --> Color
3 --> Size 
4 --> NA

Run Code Online (Sandbox Code Playgroud)

如果我知道这个单词是Brand,我会将该变量设置为1(true).在训练测试中可以这样做(因为我已经标记了所有单词)但是我怎样才能为测试集做到这一点？我不知道一个词的类别是什么(这就是我学习它的原因:D).

当前单词的N-gram子串特征(N = …

python machine-learning svm libsvm

Usi*_*Usi

2015 06-28

5
推荐指数

1
解决办法

7417
查看次数

标签统计

libsvm ×1

machine-learning ×1

python ×1

svm ×1

使用libsvm功能的例子在Python中支持向量机

标签 统计

标签统计