在pdf文件中搜索字符串

Ant*_*tte 5 .net c# pdf string search

我正在研究一个有几个pdf文件的学校项目.应该按名称功能搜索,我只需输入学生的姓名,所有带有他/她姓名的pdf文件都应该打开.做这个的最好方式是什么?我在网上寻找解决方案,我想出的就是iTextSharp,它让人更加困惑.

这可能吗?也许有人可以给我一个教程或其他东西的链接.:) 非常感谢你.

pet*_*ust 2

PDF 是一个非常复杂的规范,可能会创建如此多的变体,以至于无法可靠地解析,除非您使用与创建它相同的工具来读取它(而且通常甚至不使用)。有几种工具可以将 PDF 压缩为文本字符串(例如 pdf2text),并且可以搜索这些工具,但它不可靠。

许多 PDF 工具仅实现部分规范。有些人建议搜索 PDF 的最佳方法是将其缩小为图像,然后对其进行 OCR。