我试图弄清楚如何从存储在 MongoDB 中的博客文章中获取相关标签的列表。
数据结构
{
title: "Post #1",
tags: { "news", "politics" }
},
{
title: "Post #2",
tags: { "news", "entertainment" }
},
{
title: "Post #3",
tags: { "entertainment", "music", "theatre" }
},
{
title: "Post #4",
tags: { "entertainment", "music", "concerts" }
}
Run Code Online (Sandbox Code Playgroud)
期望的结果
如果我想获取与“娱乐”相关的标签列表,它会查询帖子以查找类似的标签。当帖子被标记为“娱乐”时,也会使用类似的标签。
我希望能够得到以下结果:
Tag Count
======== ======
music 2 (because there are 2 posts tagged with music + entertainment)
concert 1
theatre 1
news 1
Run Code Online (Sandbox Code Playgroud)
有没有办法让它尽可能接近那个?我能得到的最接近的是db.posts.find({tags: "entertainment"});在 MongoDb 之外使用然后循环并构造这些值。我正在寻找一种更有效的方法。
您可以将工作推送到写入端以保持快速读取。假设您正在尝试添加new_tag到已有的帖子中some_list_of_tags。以下代码将构建具有所需值的集合:
for old_tag in some_list_of_tags:
db.related_tags.update({'_id':new_tag}, {'$inc':{'counts.'+old_tag:1}}, upsert=True)
db.related_tags.update({'_id':old_tag}, {'$inc':{'counts.'+new_tag:1}}, upsert=True)
Run Code Online (Sandbox Code Playgroud)
然后要获得“娱乐”的结果,只需执行以下操作:
db.related_tags.find({'_id': 'entertainment'})
Run Code Online (Sandbox Code Playgroud)
您可以使用findAndModify命令自动向帖子添加标签并获取所有现有标签:
old_tags = db.posts.findAndModify({query: {_id: ID},
update: {$addToSet: {tags: new_tag}},
fields: {tags: 1}
})['tags']
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1151 次 |
| 最近记录: |