我正在考虑使用pdf.js(一种允许在网页中嵌入pdf的开源工具).没有关于如何使用它的任何文档.
我假设我做的是使用标题中引用的脚本创建一个html页面,然后在正文中,我使用文件名和位置的数组进行某种函数调用.有人可以帮我从这里出去吗?
升级后ImageMagick,将pdf转换为jpeg时,文本质量降低了:
旧图像

新图片
转换命令: convert foo.pdf foo.jpeg
旧ImageMagick版本:
[root@home]# convert -version
Version: ImageMagick 6.2.8 05/07/12 Q16 file:/usr/share/ImageMagick-6.2.8/doc/index.html
Copyright: Copyright (C) 1999-2006 ImageMagick Studio LLC
Run Code Online (Sandbox Code Playgroud)
生成的文件大小:
-rw-r--r-- 1 root root 139K Apr 2 16:11 foo-0.jpeg
-rw-r--r-- 1 root root 130K Apr 2 16:11 foo-1.jpeg
-rw-r--r-- 1 root root 334K Mar 24 14:27 foo.pdf
Run Code Online (Sandbox Code Playgroud)
升级ImageMagick后
[root@home]# convert -version
Version: ImageMagick 6.7.8-10 2012-08-17 Q16 http://www.imagemagick.org
Copyright: Copyright (C) 1999-2012 ImageMagick Studio LLC
Features: OpenMP
Run Code Online (Sandbox Code Playgroud)
生成的文件大小:
-rw-r--r-- 1 root root 60K Apr …Run Code Online (Sandbox Code Playgroud) 我正在尝试将此PDF转换为灰度:https://dl.dropboxusercontent.com/u/10351891/page-27.pdf
Ghostscript(v 9.10)与pdfwrite设备失败,"无法将色彩空间转换为灰色,将策略还原为LeaveColorUnchanged".信息.
我能够通过中间ps文件(使用gs,pdftops(v 0.24.3)或pdf2ps)转换它,但这个转换光栅化整个PDF.我尝试了很多其他的东西:使用qpdf(v 5.0.1)或pdftk(v 1.44)规范化PDF,将其转换为svg文件并通过Inkscape(v 0.48.4)转换回PDF ...似乎没什么上班.
我找到的唯一一个解决方案(在生产环境中不适合我)是在我的Mac上使用预览并手动或使用Automator脚本应用Quartz Gray Tone滤镜.
有人找到另一种工作方式吗?或者是否可以规范化PDF或修复问题以防止Ghostscript消息"无法转换颜色空间..."或以另一种方式强制颜色空间?
谢谢!
嗯,问题的标题真的说明了一切.SO上也有类似的问题.但这里有一些差异......我绝对不能在服务器上使用Office.我必须能够以编程方式转换文档.我真的不在乎它花了多少钱.显然更便宜更好,但如果你有一个好的建议,恰好是昂贵的,请随意包括它.
------编辑------
我接受了OpenOffice.org的答案,因为它似乎是最有趣的.但是,我真的很好奇其他人的想法.继续发布答案和投票,我会接受最多的选票.
如何使用 PHP Laravel 将文档 (docx) 转换为 pdf?
在转换之前,我使用 PHPWord 设置变量,之后,我想保存它或将其转换为 PDF。
我想完成以下任务:
给定html文件的路径名和pdf文件的所需路径名,使用ITextSharp将HTML文件转换为PDF.我已经看到很多代码示例接近这个但不完全是我需要的.我相信我的解决方案需要使用iTextSharp.text.html.simpleparser.HTMLWorker.ParseToList()函数,但是我无法使用它来处理实际的HTML文件并输出实际的PDF文件.
public void GeneratePDF(string htmlFileName, string outputPDFFileName)
{...}
Run Code Online (Sandbox Code Playgroud)
是我真正想要正常工作的功能.
提前致谢
编辑:以下是我尝试过的一个例子:
iTextSharp.text.Document doc = new Document();
PdfWriter.GetInstance(doc, new FileStream(Path.GetFullPath("fromHTML.pdf"), FileMode.Create));
doc.Open();
try
{
List<IElement> list = iTextSharp.text.html.simpleparser.HTMLWorker.ParseToList(new StringReader(File.ReadAllText(this.textBox1.Text)), null);
foreach (IElement elm in list)
{
doc.Add(elm);
}
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
doc.Close();
Run Code Online (Sandbox Code Playgroud)
请注意textBox1.Text包含我正在尝试转换为pdf的html文件的完整路径名,我希望将其输出到"fromHTML.pdf"
谢谢!
我已经看到了一些关于这个的线索,但在我的搜索中没有得到非常直接的答案.我有一个Web应用程序需要接受doc,docx,xls,xlsx文件并将它们转换为PDF.现在我们有一个使用Microsoft.Office.Interop.Word库的进程,它打开文档,将其打印到PS文件,然后GPL GhostScript将PS文件转换为PDF.
这个过程很有效,但总体而言有几个步骤,这最初是在几年前开发的,当时找到PDF打印驱动程序并将其连接起来更加困难.本着更新的精神,我正在寻找一种可能更好的方法来处理这个问题.主要原因是在我们的应用程序中,我们使用Web服务调用来执行转换过程的提升操作,使用较新的Windows服务器,特别是用于开发的Window 7,即使模拟也打开文件的能力导致一些问题使用Interop库.
所有这些我肯定可以理解并解决,但我想知道是否有更新更好的方法来解决这个问题.我已经研究过PDF995,但是我没有找到一种以编程方式进入并直接将文件打印到PDF的好方法.他们提供的代码是用C++编写的,我没有找到如何模仿C#中的调用.
我在一个项目中工作,需要当前的html页面转换为pdf,pdf将自动保存在服务器上的按钮点击,它的参考将保存在数据库中.如果数据来自数据库但数据可以转换视图这个表单是静态的,这意味着它在视图中有这么多单选按钮和文本框,我可以在其中编写详细信息并在单击保存按钮后选中复选框,它将保存在服务器上,并且其引用将保存在数据中基础.
原因是我不保存数据库中的数据是报告对客户端的使用较少,但如果我将数据保存在数据库中,那么数据库变得非常庞大并且处理变得复杂.因为该报告有大约100个字段.所以,如果任何人可以帮助我.
我正在使用ExpertPdf * HtmlToPdf *库。当我尝试将Element添加到PdfPage时,出现异常:“ 无法获取转换结果标头。数据接收错误。无法接收数据。错误代码:109 ”。我不知道为什么会这样。
代码如下:
PdfPage page = doc.Pages.AddNewPage();
HtmlToPdfElement htmlToPdfElement = new HtmlToPdfElement(0,0,0-1,"cos",null);
AddElementResult result = page.AddElement(htmlToPdfElement);
Run Code Online (Sandbox Code Playgroud) 我正在尝试将 PDF 中的文本设为粗体。
我正在使用 Select.Pdf (C#) 中的 HTML 到 PDF 转换器。
http://selectpdf.com/
我在 html 中包含了 text style() 但最终它不起作用。
我还尝试在 HTML 中添加强标签和 b 标签。但没有成功。
好心人救救我!
谢谢
pdf-conversion ×10
pdf ×6
c# ×3
.net ×2
asp.net ×1
asp.net-mvc ×1
c#-4.0 ×1
docx ×1
ghostscript ×1
grayscale ×1
html ×1
imagemagick ×1
itextsharp ×1
javascript ×1
laravel ×1
ms-office ×1
ms-word ×1
nuget ×1
pdf.js ×1
phpword ×1