使用iTextSharp获取指定区域中包含的文本

Gig*_*igi 5 c# itextsharp

是否有可能使用iTextSharp获取pdf文档指定区域中包含的所有文本?

在此输入图像描述

谢谢.

Bru*_*gie 9

首先,您需要以红色标记的矩形的实际坐标.在视线上,我会说x值144(2英寸)可能是正确的,但如果y值为76,我会感到惊讶,所以你必须仔细检查.

获得矩形的精确坐标后,可以使用ExtractPageContentArea示例LocationTextExtractionStrategy中的方法使用iText的文本提取功能.

有关此示例的iTextSharp版本,请参阅第15章示例的C#端口.

System.util.RectangleJ rect = new System.util.RectangleJ(70, 80, 420, 500);
RenderFilter[] filter = {new RegionTextRenderFilter(rect)};
ITextExtractionStrategy strategy = new FilteredTextRenderListener(
        new LocationTextExtractionStrategy(), filter);
text = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);
Run Code Online (Sandbox Code Playgroud)