使用iTextSharp获取指定区域中包含的文本

是否有可能使用iTextSharp获取pdf文档指定区域中包含的所有文本?

在此处输入图像描述

谢谢。

首先,您需要以红色标记的矩形的实际坐标。 在视线上,我会说x值144(2英寸)可能是正确的,但如果y值为76,我会感到惊讶,所以你必须仔细检查。

获得矩形的精确坐标后,您可以使用LocationTextExtractionStrategy来使用iText的文本提取function,如ExtractPageContentArea示例中所做的那样。

有关此示例的iTextSharp版本,请参阅第15章示例的C#端口。

 System.util.RectangleJ rect = new System.util.RectangleJ(70, 80, 420, 500); RenderFilter[] filter = {new RegionTextRenderFilter(rect)}; ITextExtractionStrategy strategy = new FilteredTextRenderListener( new LocationTextExtractionStrategy(), filter); text = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);