Chi*_*ram 0 lucene.net
可能重复: 如何索引lucene中的pdf,ppt,xl文件(基于java或python或php中的任何一个都可以)?
我需要在包含pdf,docx,txt格式的文件夹中的文件集合中搜索字符串.是否可以使用lucene.net搜索字符串.
请提供一些有用的参考..
感谢你..
Pre*_*ott 5
您需要提取各种文件的文本(pdf,docx,txt)并将该文本插入到Lucene索引中.Lucene无法从各种文档格式中读取文本
通常在.net中搜索"提取{文档格式}文本",您应该找到大量资源.
归档时间:
13 年,9 月 前
查看次数:
1578 次
最近记录: