我承认我不是一个真正的编码东西的专家等.我有以下问题:我的程序必须读取一个文本文件,其中不仅包含std.ASCII,但"特殊字符和语言" "..?????????? ?????? ????????.."如此让我们假设这是文件的内容:?????????? ?????? ????????
现在我想用单个单词拆分整个文件内容并创建另一个文件,列出所有这些单词,如:
????????????????????????我的问题是:如果我将这些单词放入HashMap并从中读取值 - >编码就会丢失.这是我的代码:
final StringBuffer fileData = new StringBuffer(1000);
final BufferedReader reader = new BufferedReader(
new FileReader("fileIn.txt"));
char[] buf = new char[1024];
int numRead = 0;
while ((numRead = reader.read(buf)) != -1)
{
final String readData = String.valueOf(buf, 0, numRead);
fileData.append(readData);
buf = new char[1024];
}
reader.close();
String mergedContent = fileData.toString();
mergedContent = mergedContent.replaceAll("\\<.*?>", " ");
mergedContent = mergedContent.replaceAll("\\r\\n|\\r|\\n", " ");
final BufferedWriter out = new BufferedWriter(
new …Run Code Online (Sandbox Code Playgroud)