我是初学者..我正在和伯特一起工作。不过由于公司网络的安全性,下面的代码没有直接接收到bert模型。
tokenizer = BertTokenizer.from_pretrained('bert-base-multilingual-cased', do_lower_case=False)
model = BertForSequenceClassification.from_pretrained("bert-base-multilingual-cased", num_labels=2)
Run Code Online (Sandbox Code Playgroud)
所以我想我必须下载这些文件并手动输入位置。但是我是新手,我想知道从 github 下载像 .py 这样的格式并将其放在某个位置是否很简单。
我目前使用的是拥抱face的pytorch实现的bert模型,找到的源文件地址为:
https://github.com/huggingface/transformers
请让我知道我认为的方法是否正确,如果正确,要获取什么文件。
提前感谢您的评论。
python github pytorch bert-language-model huggingface-transformers
让我们假设我的数据框
Name Value
0 K apple
1 Y banana
2 B orange
3 Q grape
4 C apple
5 A apple
Run Code Online (Sandbox Code Playgroud)
和我的代码
mylist = ['apple']
df1 = df['Value'].str.contains("|".join(mylist))
df['Label'] = df1
df = df[df['Label'].astype('str').str.startswith('True')]
Run Code Online (Sandbox Code Playgroud)
输出
Name Value
0 K apple
4 C apple
5 A apple
Run Code Online (Sandbox Code Playgroud)
我的问题
当我的数据框如下所示时,
Name Value
0 K apple[red]
1 Y banana[yellow]
2 B orange[orange]
3 Q grape[purple]
4 C apple[red]
5 A apple[green]
Run Code Online (Sandbox Code Playgroud)
我的代码是
mylist = ['apple[red]', 'apple[green]']
df1 = df['Value'].str.contains("|".join(mylist))
df['Label'] = df1
df …Run Code Online (Sandbox Code Playgroud)