int*_*ntl 5 regression machine-learning vowpalwabbit
我正在尝试Vowpal Wabbit,我正在计算培训和测试所需的文件格式.我一直在关注https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial的教程,看看以下是培训数据格式:
0 | price:.23 sqft:.25 age:.05 2006
1 2 'second_house | price:.18 sqft:.15 age:.35 1976
0 1 0.5 'third_house | price:.53 sqft:.32 age:.87 1924
Run Code Online (Sandbox Code Playgroud)
对于测试数据,我没有标签或任何输出,只有功能.我该如何写出来呢?我试过包括这样的功能:
price:.23 sqft:.25 age:.05 2006
price:.18 sqft:.15 age:.35 1976
price:.53 sqft:.32 age:.87 1924
Run Code Online (Sandbox Code Playgroud)
但是,这给了我例外,因为它不是正确的格式.我也尝试了下面的内容,所有结果都只给我0:
| price:.23 sqft:.25 age:.05 2006
| price:.18 sqft:.15 age:.35 1976
| price:.53 sqft:.32 age:.87 1924
0 0 0 | price:.23 sqft:.25 age:.05 2006
0 0 0 | price:.18 sqft:.15 age:.35 1976
0 0 0 | price:.53 sqft:.32 age:.87 1924
Run Code Online (Sandbox Code Playgroud)
任何我应该瞄准的格式,只知道这些特征?谢谢您的帮助.
条形符号(|)也必须采用预测格式:
| price:.23 sqft:.25 age:.05 2006
| price:.18 sqft:.15 age:.35 1976
| price:.53 sqft:.32 age:.87 1924
Run Code Online (Sandbox Code Playgroud)
如果您没有包含正确的标签,当然,vw无法计算测试损失.要使用预测vw -d test_set.vw -t -p predictions.txt.本教程中的训练集(仅有三个示例)太小,无法训练任何合理的模型.
| 归档时间: |
|
| 查看次数: |
1907 次 |
| 最近记录: |