我有以下所有分类变量的数据:
class education income social_standing
1 basic low good
0 low high V_good
1 high low not_good
0 v_high high good
Run Code Online (Sandbox Code Playgroud)
这里的教育有四个级别(基本,低,高和高).收入有两个层次的低点和高点; 而social_standing有三个级别(好,v_good和not_good).
就我将上述数据转换为VW格式的理解而言,它将是这样的:
1 |person education_basic income_low social_standing_good
0 |person education_low income_high social_standing_v_good
1 |person education_high income_low social_standing_not_good
0 |person education_v_high income_high social_standing_good
Run Code Online (Sandbox Code Playgroud)
这里,'person'是命名空间,所有其他都是特征值,以相应的特征名称为前缀.我对么?不知何故,这种特征值的表示对我来说非常困惑.有没有其他方式来表示功能?应该感谢你的帮助.
vowpalwabbit ×1