标签: semisupervised-learning

为 Snorkel 中的标签功能赋予更高的权重

我正在使用呼吸管为我的训练数据创建标签。我目前有五个用于任务的标签函数,我已将它们存储在列表中。我使用以下代码来应用标签功能:

lfs = [lf_a, lf_b, lf_c, lf_d, lf_e]
applier = PandasLFApplier(lfs)
L_train = applier.apply(df_data_sample)

# Train the label model and compute the training labels
label_model = LabelModel(cardinality=2, verbose=True)
label_model.fit(L_train, n_epochs=500, log_freq=50, seed=123)
Run Code Online (Sandbox Code Playgroud)

进入任务时,我想给予lf_e标记函数更高的权重,因为我的测试表明它比其他函数具有更高的准确性。无法做到这一点会导致其他 lfs 的输出主导lf_e的输出。而且我也不想删除任何功能,因为如果这样做我会减少我的覆盖范围。

有没有办法在 Snorkel 中做到这一点?

python nlp labeling snorkel semisupervised-learning

5
推荐指数
0
解决办法
167
查看次数

标签 统计

labeling ×1

nlp ×1

python ×1

semisupervised-learning ×1

snorkel ×1