小编Jit*_*mes的帖子

根据标签列表中该单词的索引位置，找到该单词在字符串中的开始和结束位置

我有一句话

str = 'cold weather gives me cold'

Run Code Online (Sandbox Code Playgroud)

和一个清单

 tag = ['O','O','O','O','disease']

Run Code Online (Sandbox Code Playgroud)

这表明句子中的第5个字是疾病类型。现在，我需要获取第5个单词的开始和结束位置。

如果仅使用“ cold”进行字符串搜索，它将为我提供“ cold”的起始位置，该位置最先出现。

python string list

Jit*_*mes

2019 07-25

5
推荐指数

1
解决办法

127
查看次数

gspread - 从类似数字的列中获取字符串形式的值

我正在尝试使用 gspread 库使用 python 读取谷歌表。

初始身份验证设置已完成，我可以阅读相应的工作表。

然而当我这样做时

sheet.get_all_records()

Run Code Online (Sandbox Code Playgroud)

包含类似数字值的列（例如 0001,0002,1000）将转换为数字字段。即前导零被截断。如何防止这种情况发生？

python gspread

Jit*_*mes

2019 10-16

5
推荐指数

1
解决办法

2641
查看次数

无法在Google colab上加载spacy模型'en_core_web_lg'

我在Google colab中使用spacy建立了一个NER模型，为此我使用以下命令下载了spaCy'en_core_web_lg'模型

    import spacy.cli
    spacy.cli.download("en_core_web_lg")

Run Code Online (Sandbox Code Playgroud)

我收到一条消息说

    ? Download and installation successful
    You can now load the model via spacy.load('en_core_web_lg')

Run Code Online (Sandbox Code Playgroud)

但是然后当我尝试加载模型时

    nlp = spacy.load('en_core_web_lg')

Run Code Online (Sandbox Code Playgroud)

打印以下错误：

    OSError: [E050] Can't find model 'en_core_web_lg'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.

Run Code Online (Sandbox Code Playgroud)

有人可以帮我解决这个问题吗？

python nlp spacy google-colaboratory

Jit*_*mes

2019 11-22

4
推荐指数

3
解决办法

1122
查看次数

SpaCy 自定义 NER 模型训练中“drop”的含义？

下面的代码是 SpaCy 命名实体识别 ( NER) 的示例训练循环。

for itn in range(100):
    random.shuffle(train_data)
    for raw_text, entity_offsets in train_data:
        doc = nlp.make_doc(raw_text)
        gold = GoldParse(doc, entities=entity_offsets)
        nlp.update([doc], [gold], drop=0.5, sgd=optimizer)
nlp.to_disk("/model")

Run Code Online (Sandbox Code Playgroud)

drop 是spacy辍学率。有人可以详细解释一下相同的含义吗？

python nlp named-entity-recognition spacy

Jit*_*mes

2019 12-13

4
推荐指数

1
解决办法

2130
查看次数