由于大型Web应用程序的出现,搜索数据(以及快速准确地执行此操作)一直是Web应用程序中最重要的问题之一.有一段时间,我使用Lucene.NET,它是Lucene项目的C#端口.
我也使用Zend Framework的Lucene API来使用PHP ,这让我想到了我的问题.大多数情况下,为了提供良好的索引,我们需要执行一些NLP工具,如标记化,lematizing等等,问题是:
你知道使用PHP的任何好的NLP编程框架/工具集吗?
PS:我非常了解Lucene的Zend API,但正确索引数据不仅仅是存储和依赖Lucene,还需要执行一些额外的任务,如上所述.