小编Sak*_*aku的帖子

如何确定令牌是否是 Spacy 内实体的一部分?

我有

import spacy
nlp = spacy.load("en_core_web_lg")
line = "Rio de Janeiro is the capital of.."
doc = nlp(line)
for tok in doc:
    printf(tok.lemma_)
for ent in doc.ents:
    printf(e.lemma_)
Run Code Online (Sandbox Code Playgroud)

我想获得维基化:“[[里约热内卢]] [[be|is]] [[the]] [[capital]] [[of]]..”如何确定令牌“Rio”是否是实体的一部分“里约热内卢”?

python spacy

9
推荐指数
1
解决办法
3553
查看次数

如何通过API从Wikimedia Commons下载文件?

如何从Wikimedia Commons下载大量音频(.ogg)文件?是否可以使用Mediawiki API?

download ogg mediawiki-api wikimedia-commons

2
推荐指数
1
解决办法
639
查看次数

标签 统计

download ×1

mediawiki-api ×1

ogg ×1

python ×1

spacy ×1

wikimedia-commons ×1