Doctrine Paginator 选择整个表（非常慢）？

Question

Doctrine Paginator 选择整个表（非常慢）？

Cap*_*ggz 3 php mysql pagination symfony doctrine-orm

这与这里的上一个问题相关：Doctrine/Symfony query builder add select on left join

我想使用 Doctrine ORM 执行复杂的联接查询。我想选择 10 篇分页博客文章，左侧加入单个作者，例如当前用户的价值以及文章上的主题标签。我的查询生成器如下所示：

$query = $em->createQueryBuilder()
            ->select('p')              
            ->from('Post', 'p')
            ->leftJoin('p.author', 'a')
            ->leftJoin('p.hashtags', 'h')
            ->leftJoin('p.likes', 'l', 'WITH', 'l.post_id = p.id AND l.user_id = 10')
            ->where("p.foo = bar")
            ->addSelect('a AS post_author')
            ->addSelect('l AS post_liked')
            ->addSelect('h AS post_hashtags')
            ->orderBy('p.time', 'DESC')
            ->setFirstResult(0)
            ->setMaxResults(10);

// FAILS - because left joined hashtag collection breaks LIMITS
$result = $query->getQuery()->getResult(); 

// WORKS - but is extremely slow (count($result) shows over 80,000 rows)
$result = new \Doctrine\ORM\Tools\Pagination\Paginator($query, true);

Run Code Online (Sandbox Code Playgroud)

奇怪的是，分页器上的 count($result) 显示了我的表中的总行数（超过 80,000），但使用 foreach 遍历 $result 输出了 10 个 Post 实体，正如预期的那样。我需要做一些额外的配置来正确限制我的分页器吗？

如果这是分页器类的限制，我还有什么其他选择？编写自定义分页器代码或其他分页器库？

（奖励）：如何水合数组，例如 $query->getQuery()->getArrayResult();？

编辑：我在函数中遗漏了一个杂散的 orderBy 。看起来同时包含 groupBy 和 orderBy 会导致速度减慢（使用 groupBy 而不是分页器）。如果我省略其中之一，查询就会很快。我尝试在表中的“时间”列上添加索引，但没有看到任何改进。

我尝试过的事情

// works, but makes the query about 50x slower
$query->groupBy('p.id');
$result = $query->getQuery()->getArrayResult();

// adding an index on the time column (no improvement)
indexes:
    time_idx:
        columns: [ time ]

// the above two solutions don't work because MySQL ORDER BY
// ignores indexes if GROUP BY is used on a different column
// e.g. "ORDER BY p.time GROUP BY p.id is" slow

Run Code Online (Sandbox Code Playgroud)

Answer 1

Mul*_*cek 5

您应该简化您的查询。这会减少一些执行时间。我无法测试您的查询，但这里有一些提示：

执行 count() 时不进行排序
您可以按orderBy('p.id', 'DESC')排序，将使用索引
如果连接表中始终存在至少一条记录，则可以使用join()而不是leftJoin ()。否则该记录将被跳过。

KNP/Paginator 使用 DISTINCT() 只读取不同的记录，但这可能导致使用磁盘临时表

$query->getArrayResult() 使用数组隐藏模式，返回多维数组，对于大型结果集，它比对象隐藏要快得多

你可以使用partial select('partial p.{id, otherused fields}')，这样你就可以只加载需要的字段，也许在使用对象水合作用时跳过不需要的关系

检查 SF Profiler EXPLAIN 对教义部分下的给定查询，可能未使用索引

p.hashtags 和 p.likes 只返回一行还是 oneToMany，这会使结果相乘

也许一些帖子的设计发生了变化，这会删除一些连接：

将 p.hashtags 字段定义为@ORM\Column(type="array")并存储标签的字符串值。稍后可能会对序列化数组使用全文搜索。

将 p.likesCount 字段定义为@ORM\Column(type="integer") ，其中包含喜欢的数量

我使用KnpLabs/KnpPaginatorBundle，对于复杂查询也可能存在速度问题。

通常使用 LIMIT x,z 对于数据库来说很慢，因为它在整个数据集上运行 COUNT。如果不使用索引，速度会非常慢。

您可以使用不同的方法并通过 ID 前进进行一些自定义分页，但这会使您的方法变得复杂。我已将其用于大型数据集（例如 SYSLOG 表）。但是您失去了排序和总记录计数功能。

归档时间：	9 年，3 月前
查看次数：	5700 次
最近记录：	5 年，4 月前