是否可以确定 TJ 运算符中的数字是否代表单词之间的空格?
示例:[(Sta)28(ry)-333(Plzenec,)]TJ
数字28空间不够,否则333应该根据实际字号空间。字体大小为 9.96
首先请注意,单词之间的空格数与字距调整空格数之间的分隔数没有绝对限制。您所能做的就是开发启发式方法,这对于某些文档(通常是非常严格的文档)来说会失败。
现在记住在计算从数字之前最后一个字符的原点到之后第一个字符的原点的文本替换t x或t y时如何应用这些数字:
(ISO 32000-1,第 9.4.4 节文本空间详细信息,也在此讨论)
因此,首先,如果该数字为负数,则只会扩大与下一个字符的间隙。
此外,数字是在字体大小相乘之前应用的;因此,不必像我在对该问题的评论中错误地声称的那样考虑字体大小。
该数字(按1 / 1000缩放)直接从字形位移中减去。因此,人们可以将其与相关字体的字形位移进行比较,以了解数字的含义。
字形位移本质上是相应字体的Widths或W数组(默认为MissingWidth / DW值)中按1 / 1000缩放的数字。由于TJ数字和宽度均按1 / 1000缩放,因此您可以直接比较它们。
因此,一个明显的选择是将负TJ数字的绝对值与相关字体中的空格字形的宽度进行比较。该值因字体而异,例如 Courier 为 600,Helvetica 为 278,Times-Roman 为 250。
由TJ数字创建的单词之间的空格不一定必须与字体的完整空格字形一样宽,但它的相关部分,例如其值的一半 (YMMV),可以用作解释 TJ 数字的最小值作为单词之间的空格。
但不幸的是,如果 PDF 生成器通过TJ数字创建单词之间的所有空格,而不通过空格字形创建任何空格,并且如果字体仅作为子集嵌入,则根本不需要嵌入空格字形。在这种情况下,您可能想使用其他字形进行比较;通常,大写“M”的长度被用作字体宽度的度量,您可能需要使用其相关分数,例如五分之一(又是 YMMV)。
你可以提高你的启发法