小编Qfe*_*zes的帖子

您如何建议过滤包含巨大列表中定义的攻击性词语的注释

简而言之:

JAVA /休眠/ AJAX /用SpringMVC

我想这是由用户发布的每个评论应该在服务器端读取存储到数据库中之前,并拒绝评论是否包含令人反感的文字.

攻击性文本列表相当庞大(可能是数千个).看看这个示例列表:http://onlineslangdictionary.com/lists/most-vulgar-words/

我想迭代这个列表并执行如下函数并不是那么快.还有其他方法可以更快地完成此过滤吗?您认为搜索超过千分之一的项目会对资源CPU/RAM产生重大影响吗?欢迎任何建议!

for(String offensiveText : offensiveTextList ){     
    if(commentText.contains(offensiveText )){
         //reject comment
    }
}
Run Code Online (Sandbox Code Playgroud)

更新:攻击性项目列表可以包含由其中的几个单词组成的项目(如3个单词的文本,并且可以包含停用词).它甚至可以包含非字母字符,如*&^%.

如果注释包含相应的攻势项目(正是相同的字母),那么它被认为是拒绝

java search spring filtering hibernate

3
推荐指数
1
解决办法
1056
查看次数

标签 统计

filtering ×1

hibernate ×1

java ×1

search ×1

spring ×1