try {
File file = new File("Example.pdf");
String content = new Tika().parseToString(file);
System.out.println("The Content: " + content);
} catch (Exception e) {
e.printStackTrace();
}
Run Code Online (Sandbox Code Playgroud)
我已经导入java.io.File并导入了org.apache.tika.Tika;但在运行此代码时,我收到如下错误:
线程“main”中的异常 java.lang.NoSuchMethodError: org.slf4j.spi.LocationAwareLogger.log(Lorg/slf4j/Marker;Ljava/lang/String;ILjava/lang/String;Ljava/lang/Throwable;)V at org .apache.commons.logging.impl.SLF4JLocationAwareLog.warn(SLF4JLocationAwareLog.java:162) 在 org.apache.pdfbox.pdmodel.font.FileSystemFontProvider.loadDiskCache(FileSystemFontProvider.java:461) 在 org.apache.pdfbox.pdmodel.font .FileSystemFontProvider.(FileSystemFontProvider.java:217) 在 org.apache.pdfbox.pdmodel.font.FontMapperImpl$DefaultFontProvider.(FontMapperImpl.java:130) 在 org.apache.pdfbox.pdmodel.font.FontMapperImpl.getProvider(FontMapperImpl.java :149)在org.apache.pdfbox.pdmodel.font.FontMapperImpl.findFont(FontMapperImpl.java:413)在org.apache.pdfbox.pdmodel.font.FontMapperImpl.findFontBoxFont(FontMapperImpl.java:376)在org.apache。 pdfbox.pdmodel.font.FontMapperImpl.getFontBoxFont(FontMapperImpl.java:350)在org.apache.pdfbox.pdmodel.font.PDType1Font。(PDType1Font.java:146)在org.apache.pdfbox.pdmodel.font.PDType1Font。( PDType1Font.java:79) 在 org.apache.pdfbox.pdmodel.font.PDFontFactory.createFont(PDFontFactory.java:62) 在 org.apache.pdfbox.pdmodel.PDResources.getFont(PDResources.java:143) 在 org.apache .pdfbox.contentstream.operator.text.SetFontAndSize.process(SetFontAndSize.java:60) 在 org.apache.pdfbox.contentstream.PDFStreamEngine.processOperator(PDFStreamEngine.java:838) 在 org.apache.pdfbox.contentstream.PDFStreamEngine.processStreamOperators (PDFStreamEngine.java:495)在org.apache.pdfbox.contentstream.PDFStreamEngine.processStream(PDFStreamEngine.java:469)在org.apache.pdfbox.contentstream.PDFStreamEngine.processPage(PDFStreamEngine.java:150)在org.apache。 pdfbox.text.LegacyPDFStreamEngine.processPage(LegacyPDFStreamEngine.java:139) 在 org.apache.pdfbox.text.PDFTextStripper.processPage(PDFTextStripper.java:391) 在 org.apache.tika.parser.pdf.PDF2XHTML.processPage(PDF2XHTML. java:147)在org.apache.pdfbox.text.PDFTextStripper.processPages(PDFTextStripper.java:319)在org.apache.pdfbox.text.PDFTextStripper.writeText(PDFTextStripper.java:266)在org.apache.tika.parser .pdf.PDF2XHTML.process(PDF2XHTML.java:117) 在 org.apache.tika.parser.pdf.PDFParser.parse(PDFParser.java:167) 在 org.apache.tika.parser.CompositeParser.parse(CompositeParser.java :280)在org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:280)在org.apache.tika.parser.AutoDetectParser.parse(AutoDetectParser.java:135)在org.apache.tika.Tika。 parseToString(Tika.java:527) 在 org.apache.tika.Tika.parseToString(Tika.java:642) 在 java_programs.PdfParse.main(PdfParse.java:22)