小编Vin*_*oni的帖子

在包含1亿个字符串的大文本文件中进行高效子字符串搜索(无重复字符串)

我有一个大文本文件(1.5 Gb)有100万字符串(没有重复字符串),所有字符串在文件中逐行排列.我想在java中进行wepapplication,以便当用户给出一个关键字(Substring)时,他得到包含该关键字的文件中存在的所有字符串的计数.我知道LUCENE已经有一种技术......还有其他方法可以做到这一点.我想在3-4秒内得到结果.我的系统有4GB RAM和双核心配置....需要在"JAVA ONLY"中执行此操作

java mysql lucene search file

5
推荐指数
1
解决办法
1629
查看次数

标签 统计

file ×1

java ×1

lucene ×1

mysql ×1

search ×1