我有
import spacy
nlp = spacy.load("en_core_web_lg")
line = "Rio de Janeiro is the capital of.."
doc = nlp(line)
for tok in doc:
    printf(tok.lemma_)
for ent in doc.ents:
    printf(e.lemma_)
Run Code Online (Sandbox Code Playgroud)
我想获得维基化:“[[里约热内卢]] [[be|is]] [[the]] [[capital]] [[of]]..”如何确定令牌“Rio”是否是实体的一部分“里约热内卢”?
如何从Wikimedia Commons下载大量音频(.ogg)文件?是否可以使用Mediawiki API?