填写记录中缺失的日期

flo*_*olu 9 aggregation mongoose mongodb node.js aggregation-framework

我有一个集合ProductViews

产品视图

{
    productId: '5b8c0f3204a10228b00a1745,
    createdAt: '2018-09-07T17:18:40.759Z',
}
Run Code Online (Sandbox Code Playgroud)

我有一个查询来获取特定产品的每日浏览量。

询问

ProductView.aggregate([
    { $match: { productId } },
    { $project: { day: { $substr: ["$createdAt", 0, 10] } } },
    {
        $group: {
            _id: "$day",
            count: { $sum: 1 },
            time: { $avg: "$createdAt" },
        }
    },
    { $sort: { _id: 1 } },
    {
        $project: {
            date: '$_id',
            views: '$count',
        },
    },
]).exec((err, result) => ...)
Run Code Online (Sandbox Code Playgroud)

当前结果

[
    { date: '2018-09-01', views: 1 },
    { date: '2018-09-02', views: 3 },
    { date: '2018-09-04', views: 2 },
    { date: '2018-09-05', views: 5 },
    // ...
]
Run Code Online (Sandbox Code Playgroud)

问题

问题是,这种聚合在{ date: '2018-09-03', views: 0 }0视图的日子里不会返回。这会导致数据显示不正确:在此处输入图片说明

结果应该是这样的

[
    { date: '2018-09-01', views: 1 },
    { date: '2018-09-02', views: 3 },
    { date: '2018-09-03', views: 0 },
    { date: '2018-09-04', views: 2 },
    { date: '2018-09-05', views: 5 },
    // ...
]
Run Code Online (Sandbox Code Playgroud)

PS:根据这个范围传入开始和结束日期来输出结果会很完美

mic*_*ckl 14

您需要一些额外的阶段来返回默认值。首先,您需要使用$groupwith _idset tonull将所有结果收集到一个文档中。然后,您可以将$map与天数数组一起用作输入。在其中,$map您可以使用$indexOfArray来查找当前结果集中是否存在该日期。如果是 ( index != -1) 则您可以返回该值,否则您需要使用viewsset返回默认子文档0。然后您可以使用$unwind取回文档列表并使用$replaceRoot将嵌套提升stats到顶级。

ProductView.aggregate([
    { $match: { productId: '5b8c0f3204a10228b00a1745' } },
    { $project: { day: { $substr: ["$createdAt", 0, 10] } } },
    {
        $group: {
            _id: "$day",
            count: { $sum: 1 },
            time: { $avg: "$createdAt" },
        }
    },
    { $sort: { _id: 1 } },
    {
        $project: {
            date: '$_id',
            views: '$count',
        },
    },
    {
        $group: {
            _id: null,
            stats: { $push: "$$ROOT" }
        }
    },
    {
        $project: {
            stats: {
                $map: {
                    input: [ "2018-09-01", "2018-09-02", "2018-09-03", "2018-09-04", "2018-09-05" ],
                    as: "date",
                    in: {
                        $let: {
                            vars: { dateIndex: { "$indexOfArray": [ "$stats._id", "$$date" ] } },
                            in: { 
                                $cond: {
                                    if: { $ne: [ "$$dateIndex", -1 ] },
                                    then: { $arrayElemAt: [ "$stats", "$$dateIndex" ] },
                                    else: { _id: "$$date", date: "$$date", views: 0 }
                                } 
                            }
                        }
                    }
                }
            }
        }
    },
    {
        $unwind: "$stats"
    },
    {
        $replaceRoot: {
            newRoot: "$stats"
        }
    }
]).exec((err, result) => ...)
Run Code Online (Sandbox Code Playgroud)

您可以使用简单循环在应用程序逻辑中生成静态日期列表。我相信这在 MongoDB 中也是可能的(使用$range),但它可能会使这个聚合管道复杂化。如果您对此感到满意,或者您想尝试在 MongoDB 中生成该日期数组,请告诉我。