我想比较像PRABHAKAR SHARMA和的字符串SHARMA KUMAR PRABHAKAR.目的是检查较短字符串的所有字符是否都存在于另一个字符串中.如果是这种情况,我应该获得100%匹配,否则表示匹配字符百分比的百分比.
我尝试levenshteinSim在RecordLinkage包中使用但它给出了一个数字,对应于将一个字符串更改为另一个字符串所需的更改次数.
install.packages("RecordLinkage")
require(RecordLinkage)
levenshteinSim("PRABHAKAR SHARMA","SHARMA KUMAR PRABHAKAR")
#[1] 0.3636364
Run Code Online (Sandbox Code Playgroud)
在这种情况下,我希望100%匹配.此外,还必须复制超过1,000,000条记录.
使用 R igraph 包,我有一个具有以下边的无向图:
A--B, B--C, A--C, C--D, E--F&G--H
该plot()函数绘制了整个网络,但我只想可视化包含节点的连接组件A。
如果它们不是句子中单词的第一个字符,则打算用空白替换所有元音.
对于Instance,I AM A HAPPY MINISTER=> I AM A HPPY MNSTR.有没有办法在R中实现这个?