相关疑难解决方法(0)

如何将PDF转换为HTML？

使用任何通用语言将PDF转换为HTML有哪些好的库？

html pdf pdf-scraping

use*_*644

2010 01-03

28
推荐指数

1
解决办法

2万
查看次数

如何使用iTextSharp进行文本格式化

我正在使用iTextSharp从PDF中读取文本内容.我也能读到这一点.但我正在丢失文字格式,如字体,颜色等.有没有办法获得格式.

以下是我用于确切文本的代码段 -

PdfReader reader = new PdfReader("F:\\EBooks\\AspectsOfAjax.pdf");
textBox1.Text = ExtractTextFromPDFBytes(reader.GetPageContent(1));

private string ExtractTextFromPDFBytes(byte[] input)
{
    if (input == null || input.Length == 0) return "";
    try
    {
        string resultString = "";
        // Flag showing if we are we currently inside a text object
        bool inTextObject = false;
        // Flag showing if the next character is literal  e.g. '\\' to get a '\' character or '\(' to get '('
        bool nextLiteral = false;
        // () Bracket nesting level. Text appears …

Run Code Online (Sandbox Code Playgroud)

.net c# itextsharp

Irf*_*aza

2012 09-07

20
推荐指数

1
解决办法

4万
查看次数