对于不同版本的
Adobe(以前的Acrobat)Reader,是否有任何官方命令行(开关)参考
?
我在Adobe Developer Connection上找不到任何内容.
特别是我想:
我从未在pdf中添加javascript动作.但是,我已经使用javascript做了很多web开发.对于熟悉PDF中的javascript的人,我有几个问题.
NitroPDF和Adobe Acrobat肯定支持PDF格式的javascript. 是否有存在的各种对象的标准和通过javascript操作pdf的功能? 到目前为止我发现的一切都来自Adobe.其他任何地方似乎都参考了Adobe的文档.那里有标准,还是Adobe只是"de Facto"标准?
此外,所有PDF查看器都支持JavaScript操作吗?
在我可以找到的pdf文档中使用javascript的最佳文档来自Adobe - Adobe :: Acrobat Javascript脚本指南.
NitroPDF有这个链接 - 在PDF文件中的NitroPDF :: Javascript,但它基本上只是说它支持Adobe所拥有的.
我还从Scribus发现了这个链接 - Scribus ::如何使用JavaScript增强PDF表单,但这只包括一小段代码.没有什么超级有用的.
Adobe有关于如何使用IDE为javascript设置断点等的文档.是否可以使用另一个IDE在pdf中运行javascript并有断点等...?找到像Firebug一样酷的东西真是太棒了.
请不要回答如何操作Web浏览器中加载的PDF.问题是关于从PDF文档中运行javascript.我正试图通过在PDF文档中执行javascript来探索可用的可能性.具体来说,我可以使用quickpdflibrary中的函数将javascript功能添加到现有文档中.
另一个有用的链接是使用Acrobat Javascript进行开发.显然,PDF格式的js经常被称为AcroJS或Acrobat JavaScript.
我的应用程序生成PDF供用户使用.在"内容处置" HTTP标头设置为提到这里.这被设置为"inline; filename = foo.pdf",这对于Acrobat来说应该足以在保存pdf时将"foo.pdf"作为文件名.
但是,单击嵌入浏览器的Acrobat中的"保存"按钮后,要保存的默认名称不是该文件名,而是带有斜杠的URL更改为下划线.巨大而丑陋.有没有办法在Adobe中影响这个默认文件名?
URL中有一个查询字符串,这是不可协商的.这可能很重要,但在URL的末尾添加"&foo =/title.pdf"不会影响默认文件名.
更新2:我试过了两个
content-disposition inline; filename=foo.pdf
Content-Type application/pdf; filename=foo.pdf
Run Code Online (Sandbox Code Playgroud)
和
content-disposition inline; filename=foo.pdf
Content-Type application/pdf; name=foo.pdf
Run Code Online (Sandbox Code Playgroud)
(通过Firebug验证)可悲的是,都没有奏效.
一个示例网址是
/bar/sessions/958d8a22-0/views/1493881172/export?format=application/pdf&no-attachment=true
转换为默认的Acrobat保存为文件名
http___localhost_bar_sessions_958d8a22-0_views_1493881172_export_format=application_pdf&no-attachment=true.pdf
更新3:Julian Reschke为这种情况带来了实际的洞察力和严谨性.请提出他的回答.这似乎在FF(https://bugzilla.mozilla.org/show_bug.cgi?id=433613)和IE中被打破,但在Opera,Safari和Chrome中工作.http://greenbytes.de/tech/tc2231/#inlwithasciifilenamepdf
我有一个带有嵌入式PDF的网页.我的代码看起来像这样:
<embed
type="application/pdf"
src="path_to_pdf_document.pdf"
id="pdfDocument"
width="100%"
height="100%">
</embed>
Run Code Online (Sandbox Code Playgroud)
我有这个javascript代码用于打印我的PDF:
function printDocument(documentId) {
//Wait until PDF is ready to print
if (typeof document.getElementById(documentId).print == 'undefined') {
setTimeout(function(){printDocument(documentId);}, 1000);
} else {
var x = document.getElementById(documentId);
x.print();
}
}
Run Code Online (Sandbox Code Playgroud)
执行此代码时,Acrobat插件将打开众所周知的打印对话框.像这样的东西:

两个问题:
关于我的系统的更多信息:
操作系统: Windows XP
浏览器: Internet Explorer 7
PDF插件: Acrobat Reader 9
我有一堆来自扫描文档的PDF文件.这些文件包含图像和文本的混合.有些被扫描为没有OCR的图像,因此每个PDF页面都是一个大图像,即使整个页面完全是文本.其他人使用OCR进行扫描,并包含图像和可搜索的文本,其中包含文本.在许多情况下,甚至图像中的文字也可以搜索到.
我想使用OCR,使用Acrobat 8 Pro进行自动处理以识别所有扫描文档中的文本,但我不想重新OCR过去已经通过OCR过程的文件.有没有人知道是否有办法告诉哪些只包含图像,哪些已包含可搜索的文本?
我打算在C#或VB.NET中这样做,但我不认为能够分辨两种文件是依赖于语言的.
我正在尝试使用PDFTK来旋转PDF文档中的页面.执行类似下面的操作应该不会导致页面轮换更改:
pdftk in.pdf cat 1N output out.pdf
Run Code Online (Sandbox Code Playgroud)
(这是向第1页"北"或"0度"旋转.)
在某些PDF测试文档中,它按预期工作(意味着,不会对页面进行任何更改).但是,在某些测试文档中,PDF文档旋转了90度.我尝试做的任何页面旋转都会持续应用90度.所以,如果我这样做:
pdftk in.pdf cat 1E output out.pdf
Run Code Online (Sandbox Code Playgroud)
(这是旋转页面1"东"或"90度.")结果是页面旋转180度 - 额外90度!
在Acrobat Reader中查看时,PDF看起来没问题.
这些问题测试PDF文档的唯一区别是我使用Acrobat Pro已经改变了它们的轮换.在这些已经旋转的PDF文档上应用PDFTK页面动作时,我遇到了这个问题.
知道发生了什么事吗?
我为Acrobat Reader创建了Javascript,允许您保存当前打开的选项卡.它添加了菜单项:"保存选项卡","加载选项卡"和"切换自动加载".它保存标签和页码,并恢复它们.
它对Linux来说特别有用,因为Linux上没有很多pdf阅读器.但是,我无法弄清楚如何捕获打开或关闭文档事件,或者设置一些计时器事件以自动存储当前的选项卡列表.
/*
Here is the script, put it in $HOME/.adobe/Acrobat/9.0/JavaScripts (or in
the equivalent program files folder under Windows,) and it will automatically
be loaded.
When you need to save current state, choose menu "view -> Save Tabs", to restore
recently saved tabs choose "view -> Load Tabs".
*/
var delim = '|';
var parentMenu = "View";
/*
Loading Saved Tabs
*/
function LoadTabs() {
if (global.tabs_opened == null) {
return;
}
var …Run Code Online (Sandbox Code Playgroud) 我有一堆PDF文档,其中包含表格数据,我需要将其提取为更易读的格式,以存储在电子表格,数据库或其他任何内容中.
世界上是否有任何东西(最好是免费的)可以将PDF格式的表格数据转换为更易读的格式,可以通过本机与应用程序集成,也可以通过命令行被动地或通过代码(.net)循环进程?
只要表格得到维护,就可以是任何格式(doc,html).
到目前为止我发现的任何东西都是一次性的(一次只有一个文档,我有数百个,没有发生)或者没有维护表结构.
任何想法请发布.
我正在尝试在.NET Web浏览器控件中加载PDF文档.在v10之前的Adobe Reader版本(又名"X")中,加载的PDF没有显示工具栏 - 您只能看到PDF文档.在新发布的Reader v10中,有一个我不希望看到的工具栏.我想知道是否有人知道如何隐藏这个工具栏.
我认为答案可能在于注册表,因为我没有使用直接代码来访问Reader.一切都由mime类型通过WebBrowser控件处理.
我加载PDF文件的代码如下:
string url = @"http://www.domain.com/file.pdf";
this._WebBrowser.Navigate(url);
Run Code Online (Sandbox Code Playgroud)

acrobat ×10
pdf ×7
javascript ×3
.net ×2
adobe-reader ×2
html ×2
content-type ×1
extract ×1
http ×1
linux ×1
macos ×1
ocr ×1
pdftk ×1
search ×1