我正在尝试从 pytorch 中的 BERT 模型获取输入梯度。我怎样才能做到这一点?假设 y' = BertModel(x)。我试图找到 $d(loss(y,y'))/dx$
gradient deep-learning pytorch bert-language-model huggingface-transformers
bert-language-model ×1
deep-learning ×1
gradient ×1
huggingface-transformers ×1
pytorch ×1