小编Pab*_*don的帖子

TRANSFORMERS：要求填充，但标记器没有填充标记

尝试使用相同的数据集顺序评估多个 Transformer 模型，以检查哪个模型表现更好。

型号列表是这样的：

MODELS = [
      ('xlm-mlm-enfr-1024'   ,"XLMModel"),
      ('distilbert-base-cased', "DistilBertModel"),
      ('bert-base-uncased'     ,"BertModel"),
      ('roberta-base'        ,"RobertaModel"),
      ("cardiffnlp/twitter-roberta-base-sentiment","RobertaSentTW"),
      ('xlnet-base-cased'     ,"XLNetModel"),
      #('ctrl'                ,"CTRLModel"),
      ('transfo-xl-wt103'    ,"TransfoXLModel"),
      ('bert-base-cased'       ,"BertModelUncased"),
      ('xlm-roberta-base'     ,"XLMRobertaModel"),
      ('openai-gpt'           ,"OpenAIGPTModel"),
      ('gpt2'                 ,"GPT2Model")

Run Code Online (Sandbox Code Playgroud)

所有这些都工作正常'ctrl'，直到模型返回此错误：

Asking to pad, but the tokenizer does not have a padding token. Please select a token to use as 'pad_token' '(tokenizer.pad_token = tokenizer.eos_token e.g.)' or add a new pad token via 'tokenizer.add_special_tokens({'pad_token': '[PAD]'})'.

对我的数据集的句子进行标记时。

标记化代码是

SEQ_LEN = MAX_LEN #(50)

for pretrained_weights, model_name in MODELS:

print("***************** INICIANDO " …

Run Code Online (Sandbox Code Playgroud)

python tokenize tensorflow pytorch huggingface-transformers

Pab*_*don

2023 07-06

16
推荐指数

2
解决办法

3万
查看次数

RuntimeError: 预期所有张量都在同一设备上，但发现至少有两个设备，cpu 和 cuda:0！使用我的模型进行预测时

我使用变压器（BertForSequenceClassification）训练了一个序列分类模型，但出现错误：

预计所有张量都在同一设备上，但发现至少有两个设备，cpu 和 cuda:0！（在方法wrapper__index_select中检查参数索引时）

我真的不明白问题出在哪里，如果问题出在我的模型上，问题出在我如何标记数据上，或者是什么。

这是我的代码：

加载预训练模型

model_state_dict = torch.load("../MODELOS/TRANSFORMERS/TransformersNormal",  map_location='cpu') #Doesnt work with map_location='cuda:0' neither\nmodel = BertForSequenceClassification.from_pretrained(pretrained_model_name_or_path="bert-base-uncased", state_dict=model_state_dict, cache_dir='./data')\n

Run Code Online (Sandbox Code Playgroud)\n

创建数据加载

def crearDataLoad(dfv,tokenizer): \n\n  dft=dfv  # usamos el del validacion para que nos salga los resultados y no tener que cambiar mucho codigo\n\n  #validation=dfv['text']  \n  validation=dfv['text'].str.lower()  # para modelos uncased  # el fichero que hemos llamado test es usado en la red neuronal\n  validation_labels=dfv['label']\n  \n  validation_inputs = crearinputs (validation,tokenizer)\n  validation_masks= crearmask (validation_inputs)\n …

Run Code Online (Sandbox Code Playgroud)

python pytorch huggingface-transformers

Pab*_*don

2021 11-25

11
推荐指数

1
解决办法

2万
查看次数

Python NSFW 检测模块 Nudenet 不再工作？

我一直在我的最终学位项目中使用 python 模块nudnet 。我正在使用 google colab 来运行它。

在过去的几个月里它工作正常，没有任何问题，直到昨天，当我尝试导入它时，发生了这个错误：

!pip install --upgrade nudenet
from nudenet import NudeClassifier

ImportError: cannot import name '_registerMatType' from 'cv2.cv2' (/usr/local/lib/python3.7/dist-packages/cv2/cv2.cpython-37m-x86_64-linux-gnu.so)

Run Code Online (Sandbox Code Playgroud)

我尝试通过将opencv-python-headless降级到以前的版本来解决此错误

!pip uninstall opencv-python-headless==4.5.5.62 
!pip install opencv-python-headless==4.5.1.48

Run Code Online (Sandbox Code Playgroud)

但是，当我加载分类器时，会出现此错误：

classifier = NudeClassifier()


Downloading the checkpoint to /root/.NudeNet/classifier_model.onnx
MB| |#                                                | 0 Elapsed Time: 0:00:00
Content-length not found, file size cannot be estimated.
Succefully Downloaded to: /root/.NudeNet/classifier_model.onnx

InvalidProtobuf: [ONNXRuntimeError] : 7 : INVALID_PROTOBUF : Load model from /root/.NudeNet/classifier_model.onnx failed:Protobuf parsing failed.

Run Code Online (Sandbox Code Playgroud)

我也尝试过降级nudenet模块的版本，但仍然不起作用。

先感谢您。

这是 …

python google-colaboratory onnx

Pab*_*don

2022 01-14

4
推荐指数

1
解决办法

5685
查看次数