我正在尝试获取文本文件的内容,删除除字母之外的所有内容,然后将其转换为Strings 数组,以进行单词的单独处理。我这样做是为了获取文本文件:
String temp1= IOUtils.toString(FIS,"UTF-8");
String temp2=temp1.replaceAll("[,.!;:\\r\\n]"," ");
Run Code Online (Sandbox Code Playgroud)
然后将字符串标记化,我这样做:
String[] tempStringArray = temp2.split(" ");
Run Code Online (Sandbox Code Playgroud)
问题在于创建数组时String,各种索引处都有空白,这些空白String位于换行位置,多个空格,文本文件中的标点符号等。
我希望String从我的String数组中删除这些空的s,或者以某种无法进入String数组的方式删除它们。
如何才能做到这一点?