小编mes*_*s1n的帖子

spaCy,准备训练数据:doc.char_span 返回“None”

我正在按照 spaCy 文档中的说明准备我自己的训练数据(此处)。

\n

我的问题从这一行开始:

\n
span = doc.char_span(start, end, label=label)\n
Run Code Online (Sandbox Code Playgroud)\n

对于我标记为组织(“ORG”)的实体,它似乎工作正常,即它返回一个跨度对象。但是,对于我标记为金钱 (\'MONEY\') 的实体,它返回 None 对象。

\n

这是我的训练集中的两个示例:

\n
(\'Payments from the Guardian, Kings Place, 90 York Way, London N1 9GU, for articles:\', [(18, 26, \'ORG\')]) // Returns a span object for \'Guardian\'\n\n(\'24 July 2020, received \xc3\x82\xc2\xa3100. Hours: 1 hr. (Registered 02 February 2021)\', [(24, 28, \'MONEY\')]) // Returns None for \'\xc2\xa3100\'\n
Run Code Online (Sandbox Code Playgroud)\n

注意:\xc3\x82 出现在控制台中,但它不在原始 json 文本文件中。保留它以防万一它是问题的一部分

\n

有人对我出错的地方有什么建议吗?

\n

[我对 spacy 很陌生(上周开始学习),所以请 ELI5!]

\n

UPDATE: As …

python nlp named-entity-recognition spacy spacy-3

2
推荐指数
1
解决办法
3912
查看次数

标签 统计

named-entity-recognition ×1

nlp ×1

python ×1

spacy ×1

spacy-3 ×1