我想从任何给定字符串中的任何位置找到模式,使得模式至少重复阈值次数.例如,对于字符串"a0cc0vaaaabaaaabaaaabaa00bvw",模式应该是"aaaab".另一个例子:对于字符串"ff00f0f0f0f0f0f0f0f0000",模式应为"0f".在两种情况下,阈值都被视为3,即模式应重复至少3次.
如果有人可以在R中建议一个优化的方法来寻找这个问题的解决方案,请与我分享.目前我通过使用3个嵌套循环来实现这一点,并且需要花费很多时间.
谢谢!
在数据框中,我有文字
"X1" "X2"
"1" 53 "'all.downtown@enron.com'"
"2" 54 "'all.enron-worldwide@enron.com'"
"3" 55 "'all.worldwide@enron.com'"
"4" 56 "'all_enron_north.america@enron.com'"
Run Code Online (Sandbox Code Playgroud)
如何从第2列中的字符串中删除单引号?
这是输入文件:http://www.yourfilelink.com/get.php?fid = 841283.我执行了
options(stringsAsFactors=FALSE)
x=read.csv("test1.csv", header = FALSE, sep="'").
Run Code Online (Sandbox Code Playgroud)
结果如下:http://www.yourfilelink.com/get.php?fid = 841284
而不是给135行,我只得到7行!列数是正确的,并且是13. x [6,10]也有跟随它的行的内容,在字符串中用\n分隔.
请帮帮我.我陷入了这个问题!:/