小编Aka*_*ash的帖子

将两个散点图与不同的数据点组合在一起

我有一个要求,我想在同一个绘图区域中组合两个不同的散点图.一个散点图是度量1,另一个散点图是度量2.它在R中是否可行?我添加了数据集以及代码.但不确定如何在同一个情节中合并这两个.

df1 <- data.frame(Product = c("A","B","C"),
                  ProductMetric =  c("85","90","92"),
                  CategoryMetric = c("83"),
                  Category = c("AAA"))
df1
ggplot(data=df1, mapping= aes(x=Category,y= ProductMetric))+ geom_point(size=5)+
  ggplot(data=df1, mapping= aes(x=Category,y= CategoryMetric))+ geom_point(size=5)
Run Code Online (Sandbox Code Playgroud)

所以基本上在综合结果之后,同一个图表中应该有4个圆圈,基本上我想在同一个图表中显示产品平均值和类别平均值,以便最终用户可以通过观察将产品平均值与avg类别进行比较图表.

此致,阿卡什

r ggplot2

4
推荐指数
1
解决办法
1235
查看次数

NER 使用 Spacy 库在简历解析器上没有给出正确的结果

我正在使用 SpaCY 的命名实体识别从简历中提取名称、组织等。这是我的python代码。

import spacy
import PyPDF2
mypdf = open('C:\\Users\\akjain\\Downloads\\Resume\\Al Mal Capital_Nader El Boustany_BD Manager.pdf', mode='rb')
pdf_document = PyPDF2.PdfFileReader(mypdf)
first_page = pdf_document.getPage(0)
nlp = spacy.load('en_core_web_sm') 
text = first_page.extractText()
doc = nlp(text)   
for ent in doc.ents: 
    print(ent.text, ent.label_) 
Run Code Online (Sandbox Code Playgroud)

如果我看到输出,它看起来不太好。名称未正确识别。姓氏被视为组织名称,迪拜被视为人名等。

在此处输入图片说明

这是我从公共数据集获取的简历快照。

我想从一组简历中提取候选人姓名、组织、地点等。当我阅读文档时,它说使用 spaCy 的准确率超过 95%。但是在我的情况下不是。有什么办法可以提高特征提取的准确率吗?

在此处输入图片说明

python nlp named-entity-recognition spacy ner

1
推荐指数
1
解决办法
1572
查看次数

标签 统计

ggplot2 ×1

named-entity-recognition ×1

ner ×1

nlp ×1

python ×1

r ×1

spacy ×1