问题列表 - 第11800页

协作过滤:为每个用户确定产品隐含分数的方法?

实现了一个算法来推荐产品取得了一些成功,我现在正在研究计算该算法的初始输入数据的方法.

我的目标是计算用户具有某种历史记录的每种产品的分数.

我目前收集的数据:

  • 用户订单历史记录
  • 匿名用户和注册用户的产品综合浏览量历史记录

所有这些数据都带有时间戳.

我正在寻找什么

我正在寻找一些建议,理想情况下,这个问题应该更多地用于讨论,而不是针对单个"正确"的答案.

  • 我可以为用户收集的任何其他数据,这些数据可以直接暗示对产品的兴趣
  • 用于将该数据转换为每个产品的分数的算法/等式

我不想要的

为了避免这个问题被错误的答案脱轨,一旦我为每个用户提供了这些数据,这就是我正在做的事情:

  • 使用k-means聚类算法生成大量用户聚类(目前为21个),使用皮尔逊系数进行距离评分
  • 为每个用户(按需)通过在其群集中查找其最相似和最不相似的用户并重复任意深度来计算他们的类似用户的图表.
  • 根据用户图表中其他用户的偏好计算每个产品的分数
  • 对分数进行排序以返回推荐列表

基本上,我不找就怎么做,一旦我的想法输入数据(稍后我可能会需要进一步的帮助,但它不是这个问题点),只是对如何生成此输入数据的想法第一名

data-mining collaborative-filtering

6
推荐指数
1
解决办法
651
查看次数

git中的预取钩子功能

在我的场景中,我在服务器上维护一个svn同步的git存储库.我组中的所有开发人员都使用此存储库来获取更新.开发人员获取最新更改之前,
我找不到触发自动"git svn fetch"(或任何其他命令)的方法. 我目前的解决方法是让一个cron作业每5分钟同步一次svn相关的更改.是否有可能拥有这种预取钩子? 谢谢

git

9
推荐指数
1
解决办法
2229
查看次数

哪个Java阻塞队列最适合多个生产者和单个或多个消费者场景?

哪个Java阻塞队列最适合多个生产者和单个或多个消费者场景?

我正在使用LinkedBlockingQueue进行测试,但我得到了OutOfMemoryError异常.

我正在努力实现以下目标.

  1. producer创建一个对象并放入队列.
  2. 使用者从队列中获取数据并插入数据库.将有400个生产者,我可以根据自己的意愿调整消费者.

让我知道任何想法.

更新

制作人:应该收听Server Socket.它从套接字读取数据并构造对象(Domain对象)并放入队列.

消费者:从队列中获取对象并插入到数据库中(支持Hiberante和连接池)

这是我的真实环境.流程应该能够处理至少200条记录/秒.我正在测试流程的可扩展性以及如何改进它.我希望这会给出更好的主意.

有用的网址 :

vmoptions

监视和管理Java SE 6平台应用程序

BlockingQueue的

java queue multithreading

2
推荐指数
1
解决办法
5028
查看次数

如何在工作流活动(SharePoint)中获取上下文项

我正在为sharepoint工作流编写自定义活动,我不知道如何使用当前的工作流程项,SPWeb或SPSite.

我看到http://blogs.microsoft.co.il/blogs/davidbi/archive/2008/07/21/How-to-get-the-context-item-in-workflow-activity-sharepoint.aspx但xml例程这个解决方案对我来说太糟糕了.

也许还有另一个仅代码解决方案来获取Workflow活动中的上下文项?

sharepoint

11
推荐指数
1
解决办法
2万
查看次数

Silverlight的; 好的,坏的还是丑的?

我最近开始了一个新项目,我们计划在Silverlight中创建它.我们确实希望将其开发为RIA,并且基于之前使用其他.Net技术(例如WPF)的经验,Silverlight感觉是正确的选择.

Silverlight已经存在了好几年了,而且随着版本3的推出,我认为 - 并且给人的印象 - 它已经成为一个稳定的平台,它将会存在很长一段时间.但是,我仍然看到人们在抱怨Silverlight - 说它是不应该发布的糟糕技术.我得到的印象是,这些抱怨者通常对Silverlight没有任何实际经验.通常基于对微软的普遍怀疑.和; 我是从非Windows用户那里得到的; "好吧,如果你正在创造这个就是Silverlight让我不再使用它",但我认为Moonlight会解决这个问题?

所以; 是对Silverlight应有的怀疑,还是让Silverlight成为一个很好的平台,我们可以毫不畏惧地开发我们的新项目?

.net silverlight

4
推荐指数
1
解决办法
1994
查看次数

无法在Linux中的python命令行中编辑行

我在Linux下运行Python CLI:

bla:visualization> python
Python 2.1.1 (#18, Nov  1 2001, 11:15:13) 
[GCC egcs-2.91.66 19990314/Linux (egcs-1.1.2 release)] on linux2
Type "copyright", "credits" or "license" for more information.
>>> 
Run Code Online (Sandbox Code Playgroud)

由于某种原因,箭头键和删除键不起作用:

删除:

>>> x^H^H^H
Run Code Online (Sandbox Code Playgroud)

向上箭头:

>>> x^[[A^[[A
Run Code Online (Sandbox Code Playgroud)

等等...

我怎样才能做这些工作?

python linux command-line

3
推荐指数
1
解决办法
432
查看次数

Quartz.Net 工作进度

IJob 是否有一种简单的方法可以从 Job 中发布数据。我有一个运行导入过程的作业,但想通过查找作业并请求它来检索进度。

我以为我可以使用 JobDetails,但似乎没有反映在 Job 中所做的更改?

c# quartz-scheduler

3
推荐指数
2
解决办法
3903
查看次数

Scala 2.8和Scala 2.7之间最大的区别是什么?

我在Scala 2.7.5中编写了一个相当大的程序,现在我期待2.8版本.但我很好奇Scala演变的这一重大飞跃将如何影响我.

这两个版本的Scala之间最大的区别是什么?也许最重要的是:

  • 需要重写一下吗?
  • 重写任何东西只是为了利用一些很酷的新功能吗?
  • 一般来说,Scala 2.8的新功能究竟是什么?

scala

58
推荐指数
5
解决办法
9420
查看次数

结合semacodes和隐写术?

更新 我很久以前就问过这个问题了,如果我提出这个问题,我是否感兴趣?

我甚至不知道这种算法是否有一个术语,我想如果还没有人发明它的话就不会有.然而,它也使谷歌搜索有点困难.有谁知道这个算法/​​原理是否有一个术语呢?


这是我一直在考虑的一个想法,但我不太清楚如何解决它.我想知道是否存在这样的解决方案,或者你们是否知道如何实现这一点.

隐写术

隐写术基本上是隐藏信息的艺术.在现代,我们通过例如修改图像中的最低有效位来进行数字化,如下所示.因此,对于每个像素和该像素的每个颜色分量,我们可能能够隐藏一个或两个字节.

这种交替不是肉眼可见的,但是分析最不重要的比特可能揭示暴露隐藏信息的存在和可能内容的模式.为了解决这个问题,我们只需在将消息嵌入图像之前加密消息,这样可以保证消息的安全,并有助于防止发现隐藏消息的存在.

因此,原则上,隐写术提供以下内容:

  • 隐藏任何类型的媒体数据中的加密消息.(图像,音乐,视频等)
  • 在没有正确密钥的情况下完全否定隐藏消息的存在.
  • 使用正确的密钥提取隐藏的消息.

http://www.cs.vu.nl/~ast/books/mos2/zebras.jpg

Semacodes

Semacodes是一种以可视化表示方式对数据进行编码的方式,可以轻松地进行打印,复制和扫描.下面显示的数据矩阵是包含着名的Lorem Ipsum文本的semacode示例.这本质上是一个具有更高容量的二维条码,通常是条形码.用于生成semacodes的程序很容易获得,并且同样适用于阅读它们的软件,特别是对于手机.Semacodes通常包含纠错码,通常非常强大,并且可以在非常损坏的条件下读取.

因此,semacodes具有以下属性:

  • 可以打印和复制的数据编码.
  • 即使在受损(脏)的情况下也可以进行扫描和解释,并且通常是非常强大的编码.

结合它

所以我的想法是创建一些将这两者结合起来的东西,以及所有组合属性.这意味着它必须:

  • 在任何媒体中嵌入加密邮件,可能是扫描图像.
  • 即使图像被打印和扫描,甚至部分损坏,该消息也应该是可提取的.
  • 如果没有用于加密的密钥,则无法检测到嵌入消息的存在.

那么,首先我想知道是否有任何解决方案,算法或研究?其次,我想听听有关如何做到这一点的任何想法/想法?

我真的希望能够很好地讨论实现这样的事情的可能性和可行性,我期待着阅读你的答案.

更新

感谢您对此的所有良好投入.当我有更多时间时,我可能会更多地研究这个想法.我确信它一定是可能的.想想在音乐和电影中嵌入水印的研究.

algorithm encoding persistence steganography barcode

6
推荐指数
1
解决办法
1502
查看次数

[[]]中的Bash ==运算符太聪明了!

一个很好的例子.我想知道一组文件是否作为第一行'------'.

所以,

for file in *.txt
do
    if [[ `head -1 "$file"` == "------" ]]
    then
        echo "$file starts with dashes"
    fi
done
Run Code Online (Sandbox Code Playgroud)

事情是,head使用换行符返回内容,但"------"没有换行符.

它为什么有效?

linux bash

3
推荐指数
1
解决办法
256
查看次数