小编Jas*_*son的帖子

如何暂时关闭某些网站或所有网站的 Firefox 表单自动完成功能？

我想关闭 Firefox 自动完成功能，但仅限于特定网站——而不是整个互联网。我的语言课程有一个在线练习册，如果我需要重新做练习，自动完成功能会不断给我答案。我在网上找到的教程都告诉我清除表单历史记录。我不想这样做。我只是想让自动完成功能不适用于一组特定的网站，或者暂时关闭它。我怎样才能做到这一点？

firefox autocomplete firefox-extensions

Jas*_*son

2012 09-01

9
推荐指数

1
解决办法

3749
查看次数

使用修订时 MS Word 脚注跳过数字

我正在使用 MS Word 的“跟踪更改”功能来编辑带有大量脚注的学术文章。我遇到的问题更像是一个“功能”而不是一个错误，但我不知道如何处理它：如果我有删除脚注的文本，包括脚注，Word 会保留该脚注编号（从技术上讲，它仍然存在，只是在一个尚未被接受的变化中），因此后面的脚注跳过了一个数字。

从技术上讲，这不是问题，只是我还不能“接受”更改，因为我需要提交已编辑的文章以供发布，其中包含更改，以便编辑人员可以看到我为改进文章所做的工作。但同时，我希望文章中的脚注实际上按顺序进行，而不是跳过数字。一种理论上的解决方案是在不打开“跟踪更改”的情况下删除脚注本身，然后删除正文，但我不想让它看起来像我的工作（即使是已删除的材料）没有被正确引用显而易见的原因。

word-processing microsoft-word microsoft-word-2016

Jas*_*son

lucky-day

5
推荐指数

2
解决办法

9万
查看次数

如何在保留来自 OCR 的嵌入文本的同时压缩 Tesseract 编码的 PDF？

我一直在尝试使用 Tesseract 对我的 PDF 进行 OCR，并且大部分都取得了成功，尤其是德国 Fraktur 文本（旧式哥特式印刷），Adobe Acrobat 等工具无法正确识别。

问题是Tesseract的输出文件比较大，想OCRing后压缩。但是，当我使用 Ghostscript 压缩文件时，他把嵌入的 OCR 文本搞砸了。同样，如果我使用 ImageMagick，嵌入的文本将被删除。有没有解决的办法？从理论上讲，我可以在 OCR 之前进行压缩，但这会使 OCR 准确度变差。

一般来说，我的目标是在我的输出 PDF 文件中包含高质量的 OCR 嵌入文本，并高度压缩嵌入的图像，以便文件不占用几乎相同的空间。我发现 Adobe Acrobat Pro 的“另存为其他 > 缩小尺寸的 PDF”功能可以高度压缩图像，但会搞砸任何 OCR 文本。无论文件是在 Acrobat 中进行 OCR 处理，还是使用像 Tesseract 这样的工具，都是如此。

这是我当前的工作流程，使用示例 pdf。

将 PDF 拆分为 TIFF 文件

pdftk infile.pdf burst output "temp/page_%03d.pdf"
dpi=130 #this is the dpi of the particular file
parallel convert -verbose -density $dpi "{}" -depth 8 -background white -compress zip "{}.tiff" ::: temp/*.pdf

Run Code Online (Sandbox Code Playgroud)

在每个 TIFF …

compression pdf ocr adobe-acrobat tesseract-ocr

Jas*_*son

lucky-day

5
推荐指数

0
解决办法

1546
查看次数