我正在尝试构建一个 datasetDictionary 对象来在 PyTorch 上训练 QA 模型。我有这两个不同的数据集:
test_dataset
Dataset({
features: ['answer_text', 'answer_start', 'title', 'context', 'question', 'answers', 'id'],
num_rows: 21489
})
Run Code Online (Sandbox Code Playgroud)
和
train_dataset
Dataset({
features: ['answer_text', 'answer_start', 'title', 'context', 'question', 'answers', 'id'],
num_rows: 54159
})
Run Code Online (Sandbox Code Playgroud)
在数据集的文档中我没有找到任何内容。我是个菜鸟,因此解决方案可能非常简单。我希望获得的是这样的:
dataset
DatasetDict({
train: Dataset({
features: ['answer_text', 'answer_start', 'title', 'context', 'question', 'answers', 'id'],
num_rows: 54159
})
test: Dataset({
features: ['answer_text', 'answer_start', 'title', 'context', 'question', 'answers', 'id'],
num_rows: 21489
})
})
Run Code Online (Sandbox Code Playgroud)
我真的不知道如何使用两个数据集来创建 dataserDict 或如何设置键。此外,我希望将训练集“切割”为两部分:训练集和验证集,但这段话对我来说很难处理。最终结果应该是这样的:
dataset
DatasetDict({
train: Dataset({
features: ['answer_text', 'answer_start', 'title', 'context', 'question', 'answers', …Run Code Online (Sandbox Code Playgroud) 我正在使用 Yup 根据验证模式验证嵌套数据对象。我想检索第一个验证错误的路径。我用validate()尝试过,是的。它有默认为 true 的选项abortEarly。因此在这种情况下应该返回第一个错误。
但是,我总是收到最后一个错误。我不确定我错过了什么。
下面是我迄今为止尝试过的代码。
const validationSchema = Yup.object().shape({
basicDetails: Yup.object().shape({
firstName: Yup.string().required("Required first name"),
lastName: Yup.string().required("Required last name"),
gender: Yup.string().required("Required gender"),
phoneNumber: Yup.string().required("Required phone number"),
emailId: Yup.string().required("Email id is required")
}),
educationDetails: Yup.object().shape({
graduationDegree: Yup.string().required("Required graduation degree"),
postGraduationDegree: Yup.string().required(
"Required post graduation degree"
),
registrationNumber: Yup.string().required("Required registration number"),
workExperience: Yup.string().required("Required work experience")
})
});
const dataObject = {
basicDetails: {
firstName: "Nik",
lastName: "Test",
gender: "male",
phoneNumber: "9876543210",
emailId: ""
},
educationDetails: { …Run Code Online (Sandbox Code Playgroud)