我需要运行一些分析,从PDF文档中提取数据.
使用iTextSharp,我使用该PdfTextExtractor.GetTextFromPage方法从PDF文档中提取内容,并在一个长行中返回给我.
有没有办法逐行获取文本,以便我可以将它们存储在数组中?这样我就可以逐行分析数据,这将更加灵活.
以下是我使用的代码:
string urlFileName1 = "pdf_link";
PdfReader reader = new PdfReader(urlFileName1);
string text = string.Empty;
for (int page = 1; page <= reader.NumberOfPages; page++)
{
text += PdfTextExtractor.GetTextFromPage(reader, page);
}
reader.Close();
candidate3.Text = text.ToString();
Run Code Online (Sandbox Code Playgroud)