我们可以从 AutoModel(TFAutoModel) 函数创建一个模型:
from transformers import AutoModel
model = AutoModel.from_pretrained('distilbert-base-uncase')
Run Code Online (Sandbox Code Playgroud)
另一方面,模型是由 AutoModelForSequenceClassification(TFAutoModelForSequenceClassification) 创建的:
from transformers import AutoModelForSequenceClassification
model = AutoModelForSequenceClassification('distilbert-base-uncase')
Run Code Online (Sandbox Code Playgroud)
据我所知,这两个模型都使用 distilbert-base-uncase 库来创建模型。从方法名称来看,第二个类(AutoModelForSequenceClassification)是为序列分类创建的。
但是两个类别的真正区别是什么?以及如何正确使用它们?
(我在huggingface上搜索过,但不清楚)
一般来说,我们会df.drop('column_name', axis=1)删除DataFrame中的一列。我想将此变压器添加到管道中
例子:
numerical_transformer = Pipeline(steps=[('imputer', SimpleImputer(strategy='mean')),
('scaler', StandardScaler(with_mean=False))
])
Run Code Online (Sandbox Code Playgroud)
我该怎么做?