Ash*_*iya 15 java architecture solr mahout
我一直在阅读有关使用Solr和Mahout开发推荐系统的信息.
据我了解,他们处理两个不同的问题.
(或StackOverflow中的"相关"功能)
我的问题,
他们习惯于解决两个不同的问题吗?
它们可以整合吗?
我读过Mahout做离线处理和可扩展.这是否意味着Solr无法扩展?
Sea*_*wen 11
这些是针对不同问题的不同工具.Solr并没有真正提出建议,它建议基于内容的类似文件.在与用户无关的意义上,这不是个性化的.这个具体问题非常好.
Taste/Mahout用于协同过滤,这不是特定于文档或任何其他类型的事物,并且在"类似项目"中至关重要,并且推荐基于用户项交互,而不是项属性.
两者都可以很好地扩展,具体取决于您的需求和意义.没有理由怀疑Solr.
关于Mahout和推荐者,简而言之,它有两部分.一件(Taste)是实时的,而不是基于Hadoop的,并且在一台机器上扩展到适度数据集(可能是10M数据点).然后,Mahout添加了一个基于Hadoop,非实时的批量实现,可以扩展更大.(广告:我是上述的主要作者,我正在开发基于Myrrix的下一代系统.如果您对可扩展和实时Mahout风格的推荐者感兴趣,它会很有吸引力.)
如果您对基于上述平台的公司感兴趣,包括Solr,您应该看看NGDATA.
你是对的,他们解决了两个不同的问题,到目前为止我还没有看到/发现任何可以开箱即用的现有集成。
您可以做的是使用 Mahout 分类结果向索引文档添加更多信息,然后将其用于增强目的。
关于您的最后一个答案 - Solr 可以扩展,在刚刚发布的 4.0 版本中,它甚至可以比以前更好地扩展。但它解决了不同的目的,并且可以很好地扩展。
你的问题有点不具体,所以我希望这能在某种程度上有所帮助。
干杯
| 归档时间: |
|
| 查看次数: |
4571 次 |
| 最近记录: |