我有一系列账单和发票,所以文中没有上下文(我的意思是他们不讲故事).我想从这些账单中提取人名.我尝试过OpenNLP但是训练模型的质量并不好,因为我没有上下文.所以第一个问题是:我可以训练模型只包含没有上下文的人名吗?如果可能的话,你可以给我一篇关于我如何构建新模型的好文章(我阅读的大部分文章都没有解释我应该为构建新模型所采取的步骤).
我的数据库名称超过100,000个人名(名字,姓氏),所以如果NER系统在我的情况下不起作用(因为没有上下文),那么搜索这些候选人的最佳方法是什么(I是指用所有其他姓氏搜索每个名字?)
谢谢.
(yolo-对象检测)
如果图像中有两只狗,而我在训练集中存在的所有图像中仅对其中一只进行了训练,那么我未标记并对其进行训练的训练集中的另一只狗会影响过程并会导致考虑将它们作为背景的一部分? 我特别询问有关yolo darknet对象检测的问题。
似乎是这样,因为经过3000批处理后它什么也没检测到。所以问题是,我应该在所有对象上进行训练(例如所有训练集中的所有狗),还是没关系,因为yolo只会从标记的对象中提取特征而忽略背景?