小编ybi*_*bin的帖子

BERT 分词器和模型下载

我是初学者..我正在和伯特一起工作。不过由于公司网络的安全性,下面的代码没有直接接收到bert模型。

tokenizer = BertTokenizer.from_pretrained('bert-base-multilingual-cased', do_lower_case=False)
model = BertForSequenceClassification.from_pretrained("bert-base-multilingual-cased", num_labels=2) 
Run Code Online (Sandbox Code Playgroud)

所以我想我必须下载这些文件并手动输入位置。但是我是新手,我想知道从 github 下载像 .py 这样的格式并将其放在某个位置是否很简单。

我目前使用的是拥抱face的pytorch实现的bert模型,找到的源文件地址为:

https://github.com/huggingface/transformers

请让我知道我认为的方法是否正确,如果正确,要获取什么文件。

提前感谢您的评论。

python github pytorch bert-language-model huggingface-transformers

6
推荐指数
1
解决办法
1万
查看次数

为 str.contains "|" 制作正则表达式的熊猫问题 '苹果[红色]','苹果[绿色]'

让我们假设我的数据框

    Name    Value
0   K       apple
1   Y       banana
2   B       orange
3   Q       grape
4   C       apple
5   A       apple
Run Code Online (Sandbox Code Playgroud)

和我的代码

mylist = ['apple']
df1 = df['Value'].str.contains("|".join(mylist))

df['Label'] = df1
df = df[df['Label'].astype('str').str.startswith('True')]
Run Code Online (Sandbox Code Playgroud)

输出

    Name    Value
0   K       apple
4   C       apple
5   A       apple
Run Code Online (Sandbox Code Playgroud)

我的问题

当我的数据框如下所示时,

    Name    Value
0   K       apple[red]
1   Y       banana[yellow]
2   B       orange[orange]
3   Q       grape[purple]
4   C       apple[red]
5   A       apple[green]
Run Code Online (Sandbox Code Playgroud)

我的代码是

mylist = ['apple[red]', 'apple[green]']
df1 = df['Value'].str.contains("|".join(mylist))

df['Label'] = df1
df …
Run Code Online (Sandbox Code Playgroud)

python regex dataframe pandas

0
推荐指数
1
解决办法
54
查看次数