我们已经准备好一个模型,用于标识自定义命名实体。问题是,如果给出了整个文档,那么模型将无法按预期工作,如果只给出了几句话,它会给出惊人的结果。
我想选择标记实体之前和之后的两个句子。
例如。如果文档的一部分有 world Colombo(标记为 GPE),我需要选择标签之前的两个句子和标签之后的两个句子。我尝试了几种方法,但复杂性太高。
spacy 有内置的方法可以解决这个问题吗?
我正在使用 python 和 spacy。
我尝试通过识别标签的索引来解析文档。但这种方法确实很慢。
我的系统中有兼容CUDA的GPU(Nvidia GeForce 1060)。在分析更大的数据集时,我经常不得不使用seaborn库的对图函数,这会花费大量时间。有没有办法可以在GPU上运行我的整个笔记本。我的意思是,除了seaborn之外,我想在GPU上运行所有代码,这可能吗?
我在YouTube上观看了一些视频,建议使用numba python编译器和jit批注,我想知道是否存在可应用于anaconda框架的通用设置,因此无论我在anaconda上运行的什么设备都应利用GPU。
我知道tensorflow和keras可以在GPU上运行。