使用bootstrapping预测vowpal wabbit中的文件格式

mos*_*aab 4 vowpalwabbit

我正在使用VW 7.4做一些二进制分类:

cat train | vw -k --binary --cache_file cache -f model --compressed --passes 10 --loss_function hinge
Run Code Online (Sandbox Code Playgroud)

在测试时,我可以使用以下方式访问分数:

cat test | vw -t -i model -p pred
Run Code Online (Sandbox Code Playgroud)

我没有得到的是,如果我添加--bootstrap 4到训练中,那么生成的pred文件包含3列.我不知道它们中的哪一个对应于预测的分数.

ari*_*elf 5

当您使用--bootstrap <N>vowpal-wabbit时,会将多个自举样本的置信度[min max]间隔添加到每个预测行:

prediction tag min max
Run Code Online (Sandbox Code Playgroud)

前两个字段保持不变--bootstrap:

prediction tag
Run Code Online (Sandbox Code Playgroud)

(tag是可选的;它是从数据集中的相应示例中回显的,建议使用它)

您可以在Zhen Qin的演示幻灯片中找到有关他所贡献的新功能的更多详细信息(包括但不限于--bootstrap)

不相关,但必须提到:

不必stdin使用vowpal-wabbitcat file |.您可以通过将数据集文件直接传递到以下内容来保存进程vw:

vw ... filename
Run Code Online (Sandbox Code Playgroud)