让 mutool 输出“结构化文本(作为 xml)”

Cla*_*lay 1 pdf mupdf structured-text

按照 mutool 的命令说明进行draw操作
https://mupdf.com/docs/manual-mutool-draw.html

当输出“矢量格式”之一是“调试跟踪(作为 xml)”并且“输出格式是从输出文件名推断出来”时,如何输出“结构化文本(作为 xml)”?

如果我跑

mutool draw -o "testfile.xml" "testfile.pdf"
Run Code Online (Sandbox Code Playgroud)

看来我得到了“调试跟踪(作为 xml)”文件格式。

我应该使用什么文件扩展名来确保输出“结构化文本(如 xml)”格式?

ccx*_*vii 5

如果您运行不带参数的“mutool draw”,则使用消息会告诉您支持哪些格式以及它们的文件扩展名。

就您而言,您需要“stext”输出。

mutool draw -o out.stext input.pdf
mutool draw -F stext -o out.xml input.pdf
Run Code Online (Sandbox Code Playgroud)

或者,如果您更喜欢“mutool Convert”命令,它支持使用 -O 参数的高级输出选项。

mutool convert -o out.stext input.pdf
Run Code Online (Sandbox Code Playgroud)