使用Solr和Mahout的推荐系统

Ash*_*iya 15 java architecture solr mahout

我一直在阅读有关使用Solr和Mahout开发推荐系统的信息.

据我了解,他们处理两个不同的问题.

  1. 由于Solr是一个搜索引擎+分类系统,它主要用于Drupal中的"更像这样"的建议 - http://jamidwyer.com/d7/node/21.

(或StackOverflow中的"相关"功能)

  1. 在Mahout的情况下,它实现了协作过滤等机器学习算法.它可以用于根据用户以前的操作实现亚马逊中的建议等功能.(喜欢,买的物品)

我的问题,

他们习惯于解决两个不同的问题吗?

它们可以整合吗?

我读过Mahout做离线处理和可扩展.这是否意味着Solr无法扩展?

Sea*_*wen 11

这些是针对不同问题的不同工具.Solr并没有真正提出建议,它建议基于内容的类似文件.在与用户无关的意义上,这不是个性化的.这个具体问题非常好.

Taste/Mahout用于协同过滤,这不是特定于文档或任何其他类型的事物,并且在"类似项目"中至关重要,并且推荐基于用户项交互,而不是项属性.

两者都可以很好地扩展,具体取决于您的需求和意义.没有理由怀疑Solr.

关于Mahout和推荐者,简而言之,它有两部分.一件(Taste)是实时的,而不是基于Hadoop的,并且在一台机器上扩展到适度数据集(可能是10M数据点).然后,Mahout添加了一个基于Hadoop,非实时的批量实现,可以扩展更大.(广告:我是上述的主要作者,我正在开发基于Myrrix的下一代系统.如果您对可扩展和实时Mahout风格的推荐者感兴趣,它会很有吸引力.)

如果您对基于上述平台的公司感兴趣,包括Solr,您应该看看NGDATA.


pag*_*gid 3

你是对的,他们解决了两个不同的问题,到目前为止我还没有看到/发现任何可以开箱即用的现有集成。

您可以做的是使用 Mahout 分类结果向索引文档添加更多信息,然后将其用于增强目的。

关于您的最后一个答案 - Solr 可以扩展,在刚刚发布的 4.0 版本中,它甚至可以比以前更好地扩展。但它解决了不同的目的,并且可以很好地扩展。

你的问题有点不具体,所以我希望这能在某种程度上有所帮助。

干杯