小编fas*_*der的帖子

“从选择中查找标签”在带标签的 pdf 中不起作用?

我已经使用 pdfbox 标记了 pdf。

我是如何被标记的:我没有提取文本和标记,而是将 mcid 添加到现有的内容流中(打开和关闭,例如:/p<< MCID 0 >> BDC .. .. .. EMC)然后我添加标记内容以记录根目录结构。

什么工作:几乎一切都像完全标记的pdf一样正常工作。它也通过了 PAC3 可访问性检查器。

//Adding tags
tokens.add(++ind, type_check(t_ype, page));
currentMarkedContentDictionary = new COSDictionary();
currentMarkedContentDictionary.setInt(COSName.MCID, mcid);
if (altText != null && !altText.isEmpty()) {
    currentMarkedContentDictionary.setString(COSName.ALT, altText);
}
mcid++;
tokens.add(++ind, currentMarkedContentDictionary);
tokens.add(++ind, Operator.getOperator("BDC"));

// Adding marked content to root structure
structureElement.appendKid(markedContent);

currentSection.appendKid(structureElement);             
Run Code Online (Sandbox Code Playgroud)

什么不起作用:标记一个未来后 标记结构中缺少。有一个名为“从选择中查找标签”的选项。不管用。当我选择一些测试并在根结构中按“从选择中查找标签”时,它将是最后一个标签。请在下面的链接中找到pdf。

https://drive.google.com/file/d/11Lhuj50Bb9kChvD0kL_GOHQn4RNKZ0hR/view?usp=sharing

父树:

https://drive.google.com/file/d/109xhUpqsQSFLPJB2nhXoU9ssMKnyht3G/view?usp=sharing

带有标记和父树的额外文档:https : //drive.google.com/file/d/1yzZSsjkb5_dGfq1Wu3VxsH73vr3alRmC/view?usp=sharing

请帮我解决这个问题。

新问题: 我观察到

当大白鲨阅读我的标记文档时,我正在按下 Windows 机器中的 ctl+shift+5 等控件。它将显示诸如下拉>“基于标记结构读取”或>“左上到右下”以及两个单选按钮下方的选项

阅读当前页面 阅读您可以看到的所有页面图像。在 adobe dc 中按 Shift+CTL+5 你可以在这里看到图片

我选择了“根据标签结构阅读并阅读当前页面”现在下巴没有阅读标签结构。但是,如果我对“阅读整个文档”使用相同的文档,它是否阅读完美?

链接到文档:

https://drive.google.com/file/d/1CguMHa4DikFMP15VGERnPNWRq5vO3u6I/view?usp=sharing …

java pdf itext pdfbox

5
推荐指数
1
解决办法
631
查看次数

标签 统计

itext ×1

java ×1

pdf ×1

pdfbox ×1