在java中读取html文件

ade*_*esh 0 java file-read bufferedreader

在 java 中,我必须读取多个文件来搜索一些文本。文件包含大量 html 数据,因此很难借助以下代码读取 html 文件的内容。是使用 java 获取文件内容的任何直接方法。我正在使用以下代码,但它使我的应用程序变慢,建议我选择它的最佳替代方案

try{
   FileReader fr=new FileReader("path of the html file");
   BufferedReader br= new BufferedReader(fr);
    String content="";
   while((s=br.readLine())!=null)
    {

     content=content+s;

    } 

     System.out.println("content is"+content);
   }
  catch(Exception ex)
   {

    }
Run Code Online (Sandbox Code Playgroud)

Pet*_*ter 5

在循环中完成字符串连接总是很慢

您需要将其更改为使用 StringbBuilder 并为该 StringBuilder 提供合适的起始大小。

FileReader fr=new FileReader("path of the html file");
BufferedReader br= new BufferedReader(fr);
StringBuilder content=new StringBuilder(1024);
while((s=br.readLine())!=null)
    {
    content.append(s);
    } 
Run Code Online (Sandbox Code Playgroud)