相关疑难解决方法(0)

Cas.*eharden
acr.*otic
syn.*thesizing
sub.*abbot
iss.*acharite
bot.*onne
dis.*similatory
ove.*rmantel
isa.*tin
ado.*nijah
sol.*ution
zei.*st
fam.*ousness
inq.*uisitress
aor.*tography
via.*duct
ama.*sa
der.*ive
pie.*tas
kit.*chenette

Run Code Online (Sandbox Code Playgroud)

在这样做时,我观察到grep所需的时间不会与正则表达式的数量呈线性增长.实际上,它似乎呈指数级增长.

实验

系统: Intel(R)Core(TM)i5-5200U CPU @ 2.20GHz; 4个核心; 8 GB RAM

案例1:20 regexps

命令grep -c -f patterns.txt subtitles.txt计数2214次并且需要
2,19s用户0,00s系统99%cpu 2,192总计.

案例2:30 regexps

如果我将以下表达式添加到patterns.txt

ort.*hros
ove.*ridentify
mis.*tiest
pay.*ne
int.*erchasing
jej.*uneness
sta.*lactiform
und.*ertrain
cob.*bles
Sub.*category

Run Code Online (Sandbox Code Playgroud)

命令grep -c -f patterns.txt subtitles.txt计数2894次并占用71,35s用户0,06s系统99%cpu 1:11,42总计.

案例3:35个正则表达式

再添加五个表达式:

dis.*embosom
imp.*ortunateness
ema.*thion
rho.*mb
haz.*elwood

Run Code Online (Sandbox Code Playgroud)

命令 …

regex performance grep

Ped*_*ero

lucky-day

7
推荐指数

1
解决办法

152
查看次数

在文本中搜索特殊字符串的最佳方法

如果我有一个大约3000个字符的文本.我想搜索具有某些特征的字符串,例如字符串[*].

也就是说,我想[a]和[bc]来自

sjfhshdkfjhskdhfksdf[a]sfdsgfsdf[bc]

Run Code Online (Sandbox Code Playgroud)

我知道有一种称为KMP的算法可以保证通过文本进行线性时间搜索操作,但是在这里我没有找到固定的字符串,也许我必须在某个地方使用一些正则表达式.

我怎么能比O(n ^ 2)更好地做到这一点？如果我使用java,是否有任何光库？

java string algorithm search text

zon*_*ang

lucky-day

2
推荐指数

1
解决办法

180
查看次数

如何在Java中检测String中的重复单词？

可以检测字符串中重复单词的方法是什么？

例如"这是重复测试的测试消息"包含一个重复的单词测试.

这里,目标是检测String中出现的所有重复单词.

使用正则表达式对于实现目标是优选的.

java regex string duplicates pattern-matching

Deb*_*iti

2012 09-19

0
推荐指数

1
解决办法

4569
查看次数

标签统计

regex ×4

java ×3

string ×3

algorithm ×1

complexity-theory ×1

duplicates ×1

grep ×1

pattern-matching ×1

performance ×1

search ×1

text ×1

如何检查Java String是否包含至少一个大写字母,小写字母和数字？

正则表达式替换的复杂性

正则表达式 - 匹配任何单词但忽略特定单词

grep -f的性能问题

实验

案例1:20 regexps

案例2:30 regexps

案例3:35个正则表达式

在文本中搜索特殊字符串的最佳方法

如何在Java中检测String中的重复单词？

标签 统计

标签统计