小编Xan*_*der的帖子

使用iTextSharp c#从PDF中逐行提取文本

我需要运行一些分析,从PDF文档中提取数据.

使用iTextSharp,我使用该PdfTextExtractor.GetTextFromPage方法从PDF文档中提取内容,并在一个长行中返回给我.

有没有办法逐行获取文本,以便我可以将它们存储在数组中？这样我就可以逐行分析数据,这将更加灵活.

以下是我使用的代码:

       string urlFileName1 = "pdf_link";
        PdfReader reader = new PdfReader(urlFileName1);
        string text = string.Empty;
        for (int page = 1; page <= reader.NumberOfPages; page++)
        {
            text += PdfTextExtractor.GetTextFromPage(reader, page);
        }
        reader.Close();
        candidate3.Text = text.ToString();

Run Code Online (Sandbox Code Playgroud)

c# pdf extract itext carriage-return

Xan*_*der

2016 12-13

4
推荐指数

2
解决办法

3万
查看次数