我正在使用VW 7.4做一些二进制分类:
cat train | vw -k --binary --cache_file cache -f model --compressed --passes 10 --loss_function hinge
Run Code Online (Sandbox Code Playgroud)
在测试时,我可以使用以下方式访问分数:
cat test | vw -t -i model -p pred
Run Code Online (Sandbox Code Playgroud)
我没有得到的是,如果我添加--bootstrap 4到训练中,那么生成的pred文件包含3列.我不知道它们中的哪一个对应于预测的分数.
当您使用--bootstrap <N>vowpal-wabbit时,会将多个自举样本的置信度[min max]间隔添加到每个预测行:
prediction tag min max
Run Code Online (Sandbox Code Playgroud)
前两个字段保持不变--bootstrap:
prediction tag
Run Code Online (Sandbox Code Playgroud)
(tag是可选的;它是从数据集中的相应示例中回显的,建议使用它)
您可以在Zhen Qin的演示幻灯片中找到有关他所贡献的新功能的更多详细信息(包括但不限于--bootstrap)
不相关,但必须提到:
您不必stdin使用vowpal-wabbitcat file |.您可以通过将数据集文件直接传递到以下内容来保存进程vw:
vw ... filename
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1353 次 |
| 最近记录: |