标签: mahout

任何人都可以在这里发布一个如何在Apache Mahout中使用MySQLJDBCDataModel的例子,包括实例化一个DataSource吗？我想使用DataModel生成Recommendations.使用user_id,task_id和rating已经存在的Databasetable(让我们称之为评级)我只需要知道如何在不创建我自己的DataModel实现的情况下访问这些信息.

提前致谢!

mysql apache mahout

作者

2012 06-07

1
推荐指数

1
解决办法

3560
查看次数

Myrrix中的多个型号

我有一个这样的CSV文件:

typeA,typeB
typeA,typeC
typeA,typeC
typeA,typeB

这里,typeA,typeB和typeC是3种不同类型的实体.将类型B和C视为两种不同类型的项,并将类型A视为用户.

我可以通过将此CSV文件提供给Myrrix来构建模型.这个文件只有两种类型,B(以前的CSV文件中的"B"项目在这里作为用户)和D.现在,假设我有另一个这样的CSV文件:

typeB,typeD
typeB,typeD
typeB,typeD
typeB,typeD

在这里,我想获得typeB for typeB的建议.我必须有一个单独的Myrrix实例吗？是否可以有两个型号并选择推荐哪个？使用Apache Mahout这样做很容易,但是我觉得我不能像Myrrix那样获得实时setPreference和模型刷新的乐趣吗？

我很感激任何想法来解决这个问题.

recommendation-engine mahout myrrix mahout-recommender

Nil*_*esh

2013 12-17

1
推荐指数

1
解决办法

169
查看次数

如何提高朴素贝叶斯分类器的准确性？

我正在使用朴素贝叶斯分类器.遵循本教程.对于训练好的数据,我使用308个问题并将它们分类为26个手动标记的类别.在发送数据之前,我正在执行NLP.在NLP我正在执行(标点符号删除,标记化,删除词和词干)这个过滤后的数据,用作mahout的输入.使用mahout NBC我训练这些数据并获得模型文件.现在,当我跑

mahout testnb

Run Code Online (Sandbox Code Playgroud)

命令我得到正确的分类实例为96%.

现在,对于我的测试数据,我使用了100个问题,我手动标记了这些问题.当我使用经过训练的模型和测试数据时,我得到的正确分类实例为1%.这让我感到沮丧.

任何人都可以告诉我我做错了什么或建议我一些方法来提高NBC的表现.

另外,理想情况下,我应该使用多少问题数据来训练和测试？

performance hadoop tf-idf mahout

joa*_*shp

2013 08-08

1
推荐指数

1
解决办法

1717
查看次数

在java代码中使用mahout,而不是cli

我希望能够使用java构建模型,我可以使用CLI进行以下操作:

    ./mahout trainlogistic --input Candy-Crush.twtr.csv \
       --output ./model \
       --target hd_click --categories 2 \
       --predictors click_frequency country_code ctr      device_price_range hd_conversion  time_of_day num_clicks phone_type twitter is_weekend app_entertainment app_wallpaper app_widgets arcade books_and_reference brain business cards casual comics communication education entertainment finance game_wallpaper game_widgets health_and_fitness health_fitness libraries_and_demo libraries_demo lifestyle media_and_video media_video medical music_and_audio news_and_magazines news_magazines personalization photography productivity racing shopping social sports sports_apps sports_games tools transportation travel_and_local weather app_entertainment_percentage app_wallpaper_percentage app_widgets_percentage arcade_percentage books_and_reference_percentage brain_percentage business_percentage cards_percentage casual_percentage comics_percentage communication_percentage education_percentage entertainment_percentage finance_percentage game_wallpaper_percentage …

Run Code Online (Sandbox Code Playgroud)

java classification mahout

Dim*_*ima

2013 09-05

1
推荐指数

1
解决办法

2848
查看次数

Mahout是否提供了一种确定内容之间相似性的方法(基于内容的推荐)？

Mahout是否提供了确定内容之间相似性的方法？

我想将基于内容的推荐作为Web应用程序的一部分.我知道Mahout善于利用用户评级矩阵并根据它们提出建议,但我对协作(基于评级)的建议不感兴趣.我想评分两段文本的匹配程度,然后推荐与我在用户个人资料中为用户存储的文本最匹配的项目...

我已经阅读了Mahout的文档,看起来它主要促进了协作(基于评级)的建议,但不是基于内容的建议......这是真的吗？

recommendation-engine mahout content-based-retrieval mahout-recommender

use*_*072

2014 04-03

1
推荐指数

1
解决办法

2834
查看次数

基于 NodeJS 的网站推荐框架

我计划为一个基于 NodeJS 的网站添加一个推荐引擎。它目前也有一个 MongoDB 数据库作为存储层。

理想情况下，我希望在 NodeJS 中有一个Apache Mahout客户端，能够公开框架的推荐 API，但我似乎找不到。

任何基于 Web 服务的推荐框架都是不错的选择。

有任何想法吗？

apache recommendation-engine mongodb mahout node.js

Joã*_*lva

lucky-day

1
推荐指数

1
解决办法

5619
查看次数

Classpath正确编译,但不会运行.我错过了什么

问候,

我正在玩mahout,我写了一个基本的java类,它导入了一些库.编译时我的类路径似乎是正确的,我根本没有任何错误或抱怨.

但是,当我运行编译的类时,我得到一个异常说...

Exception in thread "main" java.lang.NoClassDefFoundError: Test
Caused by: java.lang.ClassNotFoundException: Test

Run Code Online (Sandbox Code Playgroud)

java linux mahout

Ste*_*eve

2010 02-21

0
推荐指数

1
解决办法

2210
查看次数

标签统计

mahout ×10

recommendation-engine ×3

apache ×2

java ×2

mahout-recommender ×2

algorithm ×1

classification ×1

content-based-retrieval ×1

eclipse ×1

hadoop ×1

k-means ×1

linux ×1

maven ×1

mongodb ×1

myrrix ×1

mysql ×1

node.js ×1

performance ×1

tf-idf ×1

标签 统计

标签统计