我有一个要求,我想在同一个绘图区域中组合两个不同的散点图.一个散点图是度量1,另一个散点图是度量2.它在R中是否可行?我添加了数据集以及代码.但不确定如何在同一个情节中合并这两个.
df1 <- data.frame(Product = c("A","B","C"),
ProductMetric = c("85","90","92"),
CategoryMetric = c("83"),
Category = c("AAA"))
df1
ggplot(data=df1, mapping= aes(x=Category,y= ProductMetric))+ geom_point(size=5)+
ggplot(data=df1, mapping= aes(x=Category,y= CategoryMetric))+ geom_point(size=5)
Run Code Online (Sandbox Code Playgroud)
所以基本上在综合结果之后,同一个图表中应该有4个圆圈,基本上我想在同一个图表中显示产品平均值和类别平均值,以便最终用户可以通过观察将产品平均值与avg类别进行比较图表.
此致,阿卡什
我正在使用 SpaCY 的命名实体识别从简历中提取名称、组织等。这是我的python代码。
import spacy
import PyPDF2
mypdf = open('C:\\Users\\akjain\\Downloads\\Resume\\Al Mal Capital_Nader El Boustany_BD Manager.pdf', mode='rb')
pdf_document = PyPDF2.PdfFileReader(mypdf)
first_page = pdf_document.getPage(0)
nlp = spacy.load('en_core_web_sm')
text = first_page.extractText()
doc = nlp(text)
for ent in doc.ents:
print(ent.text, ent.label_)
Run Code Online (Sandbox Code Playgroud)
如果我看到输出,它看起来不太好。名称未正确识别。姓氏被视为组织名称,迪拜被视为人名等。
这是我从公共数据集获取的简历快照。
我想从一组简历中提取候选人姓名、组织、地点等。当我阅读文档时,它说使用 spaCy 的准确率超过 95%。但是在我的情况下不是。有什么办法可以提高特征提取的准确率吗?