如何在pdf文件中搜索字符串

Chi*_*ram 0 lucene.net

可能重复:
如何索引lucene中的pdf,ppt,xl文件(基于java或python或php中的任何一个都可以)?

我需要在包含pdf,docx,txt格式的文件夹中的文件集合中搜索字符串.是否可以使用lucene.net搜索字符串.

请提供一些有用的参考..

感谢你..

Pre*_*ott 5

您需要提取各种文件的文本(pdf,docx,txt)并将该文本插入到Lucene索引中.Lucene无法从各种文档格式中读取文本

通常在.net中搜索"提取{文档格式}文本",您应该找到大量资源.