我想关闭 Firefox 自动完成功能,但仅限于特定网站——而不是整个互联网。我的语言课程有一个在线练习册,如果我需要重新做练习,自动完成功能会不断给我答案。我在网上找到的教程都告诉我清除表单历史记录。我不想这样做。我只是想让自动完成功能不适用于一组特定的网站,或者暂时关闭它。我怎样才能做到这一点?
我正在使用 MS Word 的“跟踪更改”功能来编辑带有大量脚注的学术文章。我遇到的问题更像是一个“功能”而不是一个错误,但我不知道如何处理它:如果我有删除脚注的文本,包括脚注,Word 会保留该脚注编号(从技术上讲,它仍然存在,只是在一个尚未被接受的变化中),因此后面的脚注跳过了一个数字。
从技术上讲,这不是问题,只是我还不能“接受”更改,因为我需要提交已编辑的文章以供发布,其中包含更改,以便编辑人员可以看到我为改进文章所做的工作。但同时,我希望文章中的脚注实际上按顺序进行,而不是跳过数字。一种理论上的解决方案是在不打开“跟踪更改”的情况下删除脚注本身,然后删除正文,但我不想让它看起来像我的工作(即使是已删除的材料)没有被正确引用显而易见的原因。
我一直在尝试使用 Tesseract 对我的 PDF 进行 OCR,并且大部分都取得了成功,尤其是德国 Fraktur 文本(旧式哥特式印刷),Adobe Acrobat 等工具无法正确识别。
问题是Tesseract的输出文件比较大,想OCRing后压缩。但是,当我使用 Ghostscript 压缩文件时,他把嵌入的 OCR 文本搞砸了。同样,如果我使用 ImageMagick,嵌入的文本将被删除。有没有解决的办法?从理论上讲,我可以在 OCR 之前进行压缩,但这会使 OCR 准确度变差。
一般来说,我的目标是在我的输出 PDF 文件中包含高质量的 OCR 嵌入文本,并高度压缩嵌入的图像,以便文件不占用几乎相同的空间。我发现 Adobe Acrobat Pro 的“另存为其他 > 缩小尺寸的 PDF”功能可以高度压缩图像,但会搞砸任何 OCR 文本。无论文件是在 Acrobat 中进行 OCR 处理,还是使用像 Tesseract 这样的工具,都是如此。
这是我当前的工作流程,使用示例 pdf。
将 PDF 拆分为 TIFF 文件
pdftk infile.pdf burst output "temp/page_%03d.pdf"
dpi=130 #this is the dpi of the particular file
parallel convert -verbose -density $dpi "{}" -depth 8 -background white -compress zip "{}.tiff" ::: temp/*.pdf
Run Code Online (Sandbox Code Playgroud)
在每个 TIFF …
假设我有一个 SSL 证书(x.509 证书),用于通过 HTTPS 提供我的个人网站。是否可以使用此证书对来自我的 Acrobat DC 中的 pdf 进行数字签名?我想使用我的 SSL 证书来做到这一点吗?
我正在尝试使用 pandoc 和特殊的 MS Word 模板将 txt 文件(markdown)转换为 docx。我这样做:
pandoc -s --reference-docx=/path/to/my/template.dotx -o outfield.docx file.md
问题是我已经用特殊的“正文段落”样式设置了模板,与“正常”样式分开(因为各种标题等都基于“正常”样式。有没有办法告诉pandoc 当它转换普通段落文本时,应该使用我特殊的“正文段落”样式来设置样式?
autocomplete ×1
compression ×1
firefox ×1
https ×1
markdown ×1
ocr ×1
pandoc ×1
pdf ×1
ssl ×1
templates ×1