我正在建立一个在线门户网站,研究人员可以上传他们的研究论文.一个要求是,所有PDF都以PDF/A格式存储.由于我无法依赖用户生成符合PDF/A的文档,因此我需要一种工具来检查标准PDF并将其转换为PDF/A格式.
你知道什么是最好的工具?
开源工具将是首选,但搜索没有发现.iText可以创建PDF/a,但转换并不容易,因为您必须阅读每个页面并将其复制到新文档,在此过程中丢失所有书签和注释.(至少据我所知,如果你知道一个简单的解决方案,请告诉我).
API应该可用于PHP,Java或者应该提供命令行工具.请不要列出仅限GUI或仅限在线的解决方案.
我给用户上传这样的文件的选项
<form action="#" onsubmit="return Checkfiles(this);">
<center><input type="file" id="filename">
<input type="submit" value="Go!"></center>
</form>
Run Code Online (Sandbox Code Playgroud)
当用户上传文件时,我使用以下 javascript 函数验证文件
<script type="text/javascript">
function Checkfiles()
{
var fup = document.getElementById('filename');
var fileName = fup.value;
var ext = fileName.substring(fileName.lastIndexOf('.') + 1);
if(ext == "pdf" )
{
return true;
}
else
{
alert("Upload pdf files only");
fup.focus();
return false;
}
}
</script>
Run Code Online (Sandbox Code Playgroud)
一切都很好。
但我想通过其他方式验证文件,而不仅仅是通过其扩展名,
我将给出这样做的理由。我将一个图像文件重命名为 image.pdf,现在它是 pdf 格式,但无法打开。
所以我想以确切的方式验证 pdf 文件。除了通过扩展名之外,还有其他方法可以检查吗?
编辑
我想在服务器端使用 jsp 页面进行验证。那我应该怎么做呢?
提前致谢 :)
如何使用开源工具检查(并另外创建)符合 PDF-A 1b 的 PDF 文档?有人知道开源工具吗?提前致谢...
我至少会检查一份文件是否声称它符合PDF/A.
我怎么能用iText做到这一点?
java ×3
pdfa ×3
pdf ×2
file-format ×1
file-upload ×1
itext ×1
javascript ×1
jsp ×1
linux ×1
open-source ×1
php ×1