小编ybi*_*bin的帖子

BERT 分词器和模型下载

我是初学者..我正在和伯特一起工作。不过由于公司网络的安全性，下面的代码没有直接接收到bert模型。

tokenizer = BertTokenizer.from_pretrained('bert-base-multilingual-cased', do_lower_case=False)
model = BertForSequenceClassification.from_pretrained("bert-base-multilingual-cased", num_labels=2)

Run Code Online (Sandbox Code Playgroud)

所以我想我必须下载这些文件并手动输入位置。但是我是新手，我想知道从 github 下载像 .py 这样的格式并将其放在某个位置是否很简单。

我目前使用的是拥抱face的pytorch实现的bert模型，找到的源文件地址为：

https://github.com/huggingface/transformers

请让我知道我认为的方法是否正确，如果正确，要获取什么文件。

提前感谢您的评论。

python github pytorch bert-language-model huggingface-transformers

ybi*_*bin

2020 05-18

6
推荐指数

1
解决办法

1万
查看次数

为 str.contains "|" 制作正则表达式的熊猫问题 '苹果[红色]'，'苹果[绿色]'

让我们假设我的数据框

    Name    Value
0   K       apple
1   Y       banana
2   B       orange
3   Q       grape
4   C       apple
5   A       apple

Run Code Online (Sandbox Code Playgroud)

和我的代码

mylist = ['apple']
df1 = df['Value'].str.contains("|".join(mylist))

df['Label'] = df1
df = df[df['Label'].astype('str').str.startswith('True')]

Run Code Online (Sandbox Code Playgroud)

输出

    Name    Value
0   K       apple
4   C       apple
5   A       apple

Run Code Online (Sandbox Code Playgroud)

我的问题

当我的数据框如下所示时，

    Name    Value
0   K       apple[red]
1   Y       banana[yellow]
2   B       orange[orange]
3   Q       grape[purple]
4   C       apple[red]
5   A       apple[green]

Run Code Online (Sandbox Code Playgroud)

我的代码是

mylist = ['apple[red]', 'apple[green]']
df1 = df['Value'].str.contains("|".join(mylist))

df['Label'] = df1
df …

Run Code Online (Sandbox Code Playgroud)

python regex dataframe pandas

ybi*_*bin

2020 03-10

0
推荐指数

1
解决办法

54
查看次数

标签统计

python ×2

bert-language-model ×1

dataframe ×1

github ×1

huggingface-transformers ×1

pandas ×1

pytorch ×1

regex ×1

BERT 分词器和模型下载

为 str.contains "|" 制作正则表达式的熊猫问题 '苹果[红色]'，'苹果[绿色]'

标签 统计

小编ybi_bin的帖子

标签统计