小编Jit*_*mes的帖子

根据标签列表中该单词的索引位置,找到该单词在字符串中的开始和结束位置

我有一句话

str = 'cold weather gives me cold' 
Run Code Online (Sandbox Code Playgroud)

和一个清单

 tag = ['O','O','O','O','disease'] 
Run Code Online (Sandbox Code Playgroud)

这表明句子中的第5个字是疾病类型。现在,我需要获取第5个单词的开始和结束位置。

如果仅使用“ cold”进行字符串搜索,它将为我提供“ cold”的起始位置,该位置最先出现。

python string list

5
推荐指数
1
解决办法
127
查看次数

gspread - 从类似数字的列中获取字符串形式的值

我正在尝试使用 gspread 库使用 python 读取谷歌表。

初始身份验证设置已完成,我可以阅读相应的工作表。

然而当我这样做时

sheet.get_all_records()
Run Code Online (Sandbox Code Playgroud)

包含类似数字值的列(例如 0001,0002,1000)将转换为数字字段。即前导零被截断。如何防止这种情况发生?

python gspread

5
推荐指数
1
解决办法
2641
查看次数

无法在Google colab上加载spacy模型'en_core_web_lg'

我在Google colab中使用spacy建立了一个NER模型,为此我使用以下命令下载了spaCy'en_core_web_lg'模型

    import spacy.cli
    spacy.cli.download("en_core_web_lg")
Run Code Online (Sandbox Code Playgroud)

我收到一条消息说

    ? Download and installation successful
    You can now load the model via spacy.load('en_core_web_lg')
Run Code Online (Sandbox Code Playgroud)

但是然后当我尝试加载模型时

    nlp = spacy.load('en_core_web_lg')
Run Code Online (Sandbox Code Playgroud)

打印以下错误:

    OSError: [E050] Can't find model 'en_core_web_lg'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.
Run Code Online (Sandbox Code Playgroud)

有人可以帮我解决这个问题吗?

python nlp spacy google-colaboratory

4
推荐指数
3
解决办法
1122
查看次数

SpaCy 自定义 NER 模型训练中“drop”的含义?

下面的代码是 SpaCy 命名实体识别 ( NER) 的示例训练循环。

for itn in range(100):
    random.shuffle(train_data)
    for raw_text, entity_offsets in train_data:
        doc = nlp.make_doc(raw_text)
        gold = GoldParse(doc, entities=entity_offsets)
        nlp.update([doc], [gold], drop=0.5, sgd=optimizer)
nlp.to_disk("/model")
Run Code Online (Sandbox Code Playgroud)

dropspacy辍学率。有人可以详细解释一下相同的含义吗?

python nlp named-entity-recognition spacy

4
推荐指数
1
解决办法
2130
查看次数