小编Rah*_*oel的帖子

使用自定义 X 和 Y 数据训练 TFBertForSequenceClassification

我正在处理一个 TextClassification 问题,为此我正在尝试在 huggingface-transformers 库中给出的 TFBertForSequenceClassification 上训练我的模型。

我按照他们的github页面上给出的示例进行操作,我能够使用给定的示例数据运行示例代码tensorflow_datasets.load('glue/mrpc')。但是,我无法找到有关如何加载我自己的自定义数据并将其传入 model.fit(train_dataset, epochs=2, steps_per_epoch=115, validation_data=valid_dataset, validation_steps=7).

我如何定义我自己的 X,对我的 X 进行标记化并使用我的 X 和 Y 准备 train_dataset。其中 X 代表我的输入文本,Y 代表给定 X 的分类类别。

样本训练数据框:

    text    category_index
0   Assorted Print Joggers - Pack of 2 ,/ Gray Pri...   0
1   "Buckle" ( Matt ) for 35 mm Width Belt  0
2   (Gagam 07) Barcelona Football Jersey Home 17 1...   2
3   (Pack of 3 Pair) Flocklined Reusable Rubber Ha...   1
4   (Summer …
Run Code Online (Sandbox Code Playgroud)

nlp pytorch tensorflow2.0 bert-language-model huggingface-transformers

9
推荐指数
3
解决办法
1203
查看次数