首先,您需要以红色标记的矩形的实际坐标.在视线上,我会说x值144(2英寸)可能是正确的,但如果y值为76,我会感到惊讶,所以你必须仔细检查.
获得矩形的精确坐标后,可以使用ExtractPageContentArea示例LocationTextExtractionStrategy中的方法使用iText的文本提取功能.
有关此示例的iTextSharp版本,请参阅第15章示例的C#端口.
System.util.RectangleJ rect = new System.util.RectangleJ(70, 80, 420, 500);
RenderFilter[] filter = {new RegionTextRenderFilter(rect)};
ITextExtractionStrategy strategy = new FilteredTextRenderListener(
new LocationTextExtractionStrategy(), filter);
text = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);
Run Code Online (Sandbox Code Playgroud)