在 Django 中使用带有 GROUP BY 子句的 COUNT(DISTINCT field)

Emm*_*Sys 4 mysql django group-by django-queryset

问题

我想在 Django 中使用COUNT(DISTINCT field)withGROUP BY子句。据我了解,COUNT(DISTINCT...只能通过使用extra查询集来实现。

我的简化模型是:

class Site(models.Model):
    name = models.CharField(max_length=128, unique=True)

class Application(models.Model):
    name = models.CharField(max_length=64)
    version = models.CharField(max_length=13, db_index=True)

class User(models.Model):
    name = models.CharField(max_length=64) 
    site = models.ForeignKey(Site, db_index=True) 

class Device(models.Model):
    imei = models.CharField(max_length=16, unique=True)

    applications = models.ManyToManyField(Application, null=True, db_index=True, through='ApplicationUsage') 
    user = models.ForeignKey(User, null=True, db_index=True)

class ApplicationUsage(models.Model):
    activity = models.DateField(db_index=True)

    application = models.ForeignKey(Application)
    device = models.ForeignKey(Device)
Run Code Online (Sandbox Code Playgroud)

我的目标是在给定一个时间段内的应用程序活动的情况下,为每个站点创建一个站点对象列表,其中包含不同设备的计数,例如

stats_site.name     deviceCount
ALBI                32
AMPLEPUIS           42
...
Run Code Online (Sandbox Code Playgroud)

我试试这个代码:

stats_site.name     deviceCount
ALBI                32
AMPLEPUIS           42
...
Run Code Online (Sandbox Code Playgroud)

生成的 SQL 是:

qs = models.Site.objects.filter(user__device__applicationusage__activity__range=[startDay, endDay])\
                            .extra(select={'deviceCount' : 'COUNT(DISTINCT `stats_device`.`id`)'})\
                            .values('name', 'deviceCount')\
Run Code Online (Sandbox Code Playgroud)

结果显然是错误的,因为它缺少GROUP BY子句,应该是GROUP BY stats_site.name

问题是:我不知道如何GROUP BY使用该annotate函数或其他方法添加正确的。

解决方案

使用distinct=TrueCount与功能annotate

qs = models.Site.objects.filter(habileouser__device__applicationusage__activity__range=[startDay, endDay])\
                            .annotate(deviceCount=Count('habileouser__device', distinct=True))\
                            .values('name', 'deviceCount')
Run Code Online (Sandbox Code Playgroud)

Pet*_*per 8

查询集的annotate方法将为查询集的每个元素计算一个聚合值,并且在values调用后使用时将聚合这些值的值。我认为这应该有效:

qs = models.Site.objects.filter(user__device__applicationusage__activity__range=[startDay, endDay]).values('name').annotate(Count('user__device', distinct=True))
Run Code Online (Sandbox Code Playgroud)

如果您指定了排序,则可能需要按照此处的讨论将其删除:https : //docs.djangoproject.com/en/dev/topics/db/aggregation/#interaction-with-default-ordering-or-order-by