我正在按照 spaCy 文档中的说明准备我自己的训练数据(此处)。
\n我的问题从这一行开始:
\nspan = doc.char_span(start, end, label=label)\nRun Code Online (Sandbox Code Playgroud)\n对于我标记为组织(“ORG”)的实体,它似乎工作正常,即它返回一个跨度对象。但是,对于我标记为金钱 (\'MONEY\') 的实体,它返回 None 对象。
\n这是我的训练集中的两个示例:
\n(\'Payments from the Guardian, Kings Place, 90 York Way, London N1 9GU, for articles:\', [(18, 26, \'ORG\')]) // Returns a span object for \'Guardian\'\n\n(\'24 July 2020, received \xc3\x82\xc2\xa3100. Hours: 1 hr. (Registered 02 February 2021)\', [(24, 28, \'MONEY\')]) // Returns None for \'\xc2\xa3100\'\nRun Code Online (Sandbox Code Playgroud)\n注意:\xc3\x82 出现在控制台中,但它不在原始 json 文本文件中。保留它以防万一它是问题的一部分
\n有人对我出错的地方有什么建议吗?
\n[我对 spacy 很陌生(上周开始学习),所以请 ELI5!]
\nUPDATE: As …