SPARQL:如何找到类似的字符串?

Ped*_*dro 4 java similarity sparql jena levenshtein-distance

我正在使用Jena来查询存储在本体中的数据.一些对象由字符串标识,但有时完全相同的字符串不可用,因为我正在处理扫描的文档,因此可能存在OCR错误.因此,我想找到最相似的字符串.有没有办法将SPARQL用于此目的?我可以以某种方式计算SPARQL中的levenshtein距离吗?

如果这是不可能的,我仍然可以计算java中的levenshtein距离.但是,有效的算法仍然需要使用SPARQL过滤掉不相关的字符串.

Gre*_*ams 6

SPARQL无法直接执行此操作,但您可以在java中实现levenshtein距离函数,并在SPARQL FILTER子句中使用它.ARQ中的扩展包含有关使用扩展功能的详细信息.