我正在处理一个 TextClassification 问题,为此我正在尝试在 huggingface-transformers 库中给出的 TFBertForSequenceClassification 上训练我的模型。
我按照他们的github页面上给出的示例进行操作,我能够使用给定的示例数据运行示例代码tensorflow_datasets.load('glue/mrpc')。但是,我无法找到有关如何加载我自己的自定义数据并将其传入
model.fit(train_dataset, epochs=2, steps_per_epoch=115, validation_data=valid_dataset, validation_steps=7).
我如何定义我自己的 X,对我的 X 进行标记化并使用我的 X 和 Y 准备 train_dataset。其中 X 代表我的输入文本,Y 代表给定 X 的分类类别。
样本训练数据框:
text category_index
0 Assorted Print Joggers - Pack of 2 ,/ Gray Pri... 0
1 "Buckle" ( Matt ) for 35 mm Width Belt 0
2 (Gagam 07) Barcelona Football Jersey Home 17 1... 2
3 (Pack of 3 Pair) Flocklined Reusable Rubber Ha... 1
4 (Summer …Run Code Online (Sandbox Code Playgroud) nlp pytorch tensorflow2.0 bert-language-model huggingface-transformers