我正在使用PDFBox来阅读PDF文件.但有些字符打印效果不佳,打印效果与控制字符类似.有人帮助从控制字符中读取值.我附上了图片请看看那个图片示例PDF:
截图:
class PDFManager {
private PDFParser parser;
private PDFTextStripper pdfStripper;
private PDDocument pdDoc ;
private COSDocument cosDoc ;
private String Text ;
private String filePath;
private File file;
public PDFManager() {
}
public String ToText() throws IOException {
this.pdfStripper = null;
this.pdDoc = null;
this.cosDoc = null;
file = new File(filePath);
parser = new PDFParser(new FileInputStream(file));
parser.parse();
cosDoc = parser.getDocument();
pdfStripper = new PDFTextStripper();
pdDoc = new PDDocument(cosDoc);
pdDoc.getNumberOfPages();
pdfStripper.setStartPage(3);
pdfStripper.setEndPage(4);
Text = pdfStripper.getText(pdDoc);
return Text;
}
public …Run Code Online (Sandbox Code Playgroud) 实际工作中,通过环列A具有与一定范围内相同的值,该范围要检查的最后日期与注释列B和打印带有日期在注释列C好心帮我找到这个解决方案问题.. 或找到此问题解决方案的指南...请查看屏幕截图以获取清晰信息.. 提前感谢专家