小编cst*_*ur4的帖子

基于项目和基于内容的协作过滤有什么区别?

我很困惑基于项目的推荐是什么,正如" Mahout in Action " 一书中所描述的那样.书中有算法:

for every item i that u has no preference for yet
  for every item j that u has a preference for
    compute a similarity s between i and j
    add u's preference for j, weighted by s, to a running average
return the top items, ranked by weighted average
Run Code Online (Sandbox Code Playgroud)

如何计算项目之间的相似度?如果使用内容,是不是基于内容的推荐?

recommendation-engine mahout mahout-recommender

22
推荐指数
2
解决办法
2万
查看次数

python中的切片,是一个副本或只是一个指针

>>>a = [3, 2]
>>>a[0:1][0] = 1
>>>a
[3, 2]

>>>a[0:1] = [1]
>>>a
[1, 2]
Run Code Online (Sandbox Code Playgroud)

什么a[0:1]意思?

  1. 如果它是指向a范围的指针,那么a[0:1][0] = 1应该改变a的值.
  2. 如果它是a范围的副本,那么a[0:1] = [1]不应该改变a的值.

我认为两者的结果彼此不一致.你能帮我解决一下这个问题吗?

python list python-2.7

7
推荐指数
2
解决办法
869
查看次数

spark.task.cpus和--executor-cores有什么区别

在我的mapPartition部分中,有多线程工作要做,我使用线程池并希望并行运行任务。但是我无法区分这两个参数。我想我可以将--executor-cores设置为5,然后在任务中运行4个线程。这是正确的吗?

multithreading apache-spark

4
推荐指数
1
解决办法
5147
查看次数