查找另一个字段mongodb的不同值组

Wie*_*iem 5 mongodb distinct-values python-3.x

我收集了这样的文件:

{
    "_id" : ObjectId("5c0685fd6afbd73b80f45338"),
    "page_id" : "1234",
    "category_list" : [  
        "football", 
        "sport"
    ],
    "time_broadcast" : "09:13"
}

{
    "_id" : ObjectId("5c0685fd6afbd7355f45338"),
    "page_id" : "1234",
    "category_list" : [ 
        "sport",
        "handball"
    ],
    "time_broadcast" : "09:13"
}

{
    "_id" : ObjectId("5c0694ec6afbd74af41ea4af"),
    "page_id" : "123456",
    "category_list" : [ 
        "news", 
        "updates"
     ],
     "time_broadcast" : "09:13"
}
Run Code Online (Sandbox Code Playgroud)

....

now = datetime.datetime.now().time().strftime("%H:%M")
Run Code Online (Sandbox Code Playgroud)

我想要的是:当“time_broadcast”等于“now”时,我得到每个“page_id”的不同“category_list”列表。

输出应如下所示:

{
   { 
     "page_id" : "1234",
     "category_list" : ["football", "sport", "handball"] 
   },

   { 
     "page_id" : "123456",
     "category_list" : ["news", "updates"] 
   }
}
Run Code Online (Sandbox Code Playgroud)

我已经尝试过这样的:

category_list = db.users.find({'time_broadcast': now}).distinct("category_list")
Run Code Online (Sandbox Code Playgroud)

但这给了我不同值的输出列表,但是

所有“page_id”:

 ["football", "sport", "handball","news", "updates"] 
Run Code Online (Sandbox Code Playgroud)

不是 page_id 的 Category_list 。

有什么帮助吗?

谢谢

Sar*_*ana 5

你需要编写一个聚合管道

  • $match- 按标准过滤文档
  • $group- 按关键字段对文档进行分组
  • $addToSet- 聚合独特的元素
  • $project- 以所需格式进行项目
  • $reduce- 将数组的数组减少为数组$concatArrays

聚合查询

db.tt.aggregate([
    {$match : {"time_broadcast" : "09:13"}}, 
    {$group : {"_id" : "$page_id", "category_list" : {$addToSet : "$category_list"}}}, 
    {$project : {"_id" : 0, "page_id" : "$_id", "category_list" : {$reduce : {input : "$category_list", initialValue : [], in: { $concatArrays : ["$$value", "$$this"] }}}}}
]).pretty()
Run Code Online (Sandbox Code Playgroud)

结果

{ "page_id" : "123456", "category_list" : [ "news", "updates" ] }
{
        "page_id" : "1234",
        "category_list" : [
                "sport",
                "handball",
                "football",
                "sport"
        ]
}
Run Code Online (Sandbox Code Playgroud)

如果需要,您可以$sort通过管道添加page_id