小编Bal*_*dur的帖子

使用 Java 中的 PDFbox 替换或删除 PDF 中的文本

我正在尝试使用 PDFBOX 2.0 替换空白或删除文本模式(在我的情况下,我想从所有 PDF 中删除所有“[QR]”单词),但我找不到任何适合我的内容。

我尝试了 itext,但还是一样,没有任何效果。

我的 pdf 中的“[QR]”字符串是在创建 PDF 后进行编辑的,也许这就是为什么它们不显示为 tj 运算符的原因?

我的主要:

replaceText(documentoPDF, "[QR]", "");
Run Code Online (Sandbox Code Playgroud)

我的方法(我打印了 Tj 值,但我的模式没有出现在那里):

public void replaceText(PDDocument documentoPDF, String searchString, String replacement) throws IOException{

    for ( PDPage page : documentoPDF.getPages()){
        
        PDFStreamParser parser = new PDFStreamParser(page);
        parser.parse();
        List<?> tokens = parser.getTokens();
        
        for (int j = 0; j < tokens.size(); j++){
            
            Object next = tokens.get(j);
            if (next instanceof Operator){
                Operator op = (Operator) next;
                
                String pstring = "";
                int prej = 0;
                
                //Tj and …
Run Code Online (Sandbox Code Playgroud)

java replace pdfbox

3
推荐指数
1
解决办法
5178
查看次数

标签 统计

java ×1

pdfbox ×1

replace ×1