在这一个我的头发上,我的双手.
我正在使用Apache PDFBox,因为我想在JAVA中逐行阅读pdf文件并稍后处理内容.但是我有以下问题..我在一个单独的java程序(在main方法中)使用了下面的代码,它在那里工作正常.但是,当我在我的tomcat服务器applet中使用它与石英调度程序一起出现问题时,我无法弄清楚原因.请记住,我将工作单独测试程序中的下面的行复制粘贴到我自己的大项目中,所以它是完全相同的代码.然而,在我更大的项目中,程序一直运行到String x1 = .. line,我放了一个断点.当我试图跨过它并没有'给出任何错误,控制台输出或任何东西,并跳过catch子句直接到最后.我在catch子句中加入了断点,它们没有被触发.
这是我的代码:
PDFTextStripper stripper;
PDDocument doc = null;
try{
doc = PDDocument.load("00026614_F_21Jan2013-18Feb2013.pdf");
stripper = new PDFTextStripper();
String x1= stripper.getText(doc); //SOMETHING GOES WRONG HERE
//break up the file content returned as a string into individual lines
List<String> ans= Arrays.asList(x1.split("\r\n"));//THIS IS NEVER REACHED
}
catch(Exception e){
e.printStackTrace(); //THIS IS NEVER REACHED EITHER
}
finally{
if(doc!=null) //IT GOES FROM STRING X1 STRAIGHT TO HERE.
doc.close();
}
Run Code Online (Sandbox Code Playgroud)
我得到的唯一输出来自LOG4J,它必须为程序的其他部分进行初始化,最后几行输出是
34212 [DefaultQuartzScheduler_Worker-1] DEBUG org.apache.pdfbox.util.PDFStreamEngine - processing substream token: PDFOperator{Tm}
34212 …Run Code Online (Sandbox Code Playgroud)