在 MySQL 8 中使用点数据类型和 st_distance_sphere 查找最近的地方

Mat*_*ran 6 mysql geospatial latitude-longitude mysql-8.0

我有一张桌子叫place

id | name       | coordinates (longitude, latitude)
1  | London     | -0.12574, 51.50853
2  | Manchester | -2.25, 53.41667
3  | Glasgow    | -4.25, 55.86667
Run Code Online (Sandbox Code Playgroud)

coordinates列是点数据类型。我place使用以下方法将点插入表中:

st_geomfromtext('point($longitude $latitude)', 4326)
Run Code Online (Sandbox Code Playgroud)

请注意,我使用了 SRID。

给定任何坐标,我想找到离它最近的地方(按升序排列)。我目前提出的解决方案(通过阅读 MySQL 文档)如下所示:

select
    *,
    st_distance_sphere(`place`.`coordinates`, st_geomfromtext('Point($longitude $latitude)', 4326)) as distance
from place
order by distance asc;
Run Code Online (Sandbox Code Playgroud)

在查看了此处和其他地方的无数类似问题后,很明显这是一种鲜为人知(和较新的方式)的做事方式,因此没有太多内容,因此我要寻求一些澄清。

我的问题是:

  1. 这是最好的解决方案/我这样做对吗?
  2. 这种方法会利用我在coordinates列上的空间索引吗?
  3. 使用st_distance_sphere 时,是否需要指定地球的半径才能获得准确的结果?(编辑:不,它默认使用地球的半径)

编辑,这里是这些答案:

explain select ...; 返回:

id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows   | filtered | Extra
1  | SIMPLE      | place | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 115687 | 100.00   | Using filesort
Run Code Online (Sandbox Code Playgroud)

flush status; select ...; show session status like 'Handler%'; 返回:

Variable_name              | Value
Handler_commit             | 1
Handler_delete             | 0
Handler_discover           | 0
Handler_external_lock      | 2
Handler_mrr_init           | 0
Handler_prepare            | 0
Handler_read_first         | 1
Handler_read_key           | 1001
Handler_read_last          | 0
Handler_read_next          | 0
Handler_read_prev          | 0
Handler_read_rnd           | 1000
Handler_read_rnd_next      | 119395
Handler_rollback           | 0
Handler_savepoint          | 0
Handler_savepoint_rollback | 0
Handler_update             | 0
Handler_write              | 0
Run Code Online (Sandbox Code Playgroud)

Ric*_*mes 1

可能是最好的解决方案。让我们先得到一些其他答案......

说什么EXPLAIN SELECT ...?(这可能会回答你的问题2)。

无论其他答案如何,您的查询都将扫描整个表。也许你想要LIMIT ...最后?

另一件可能有用的事情(取决于您的应用程序和优化器):向子句添加边界框WHERE

无论如何,请执行以下操作以准确了解实际触摸的行数:

FLUSH STATUS;
SELECT ...;
SHOW SESSION STATUS LIKE 'Handler%';
Run Code Online (Sandbox Code Playgroud)

带着这些答案回来;那么也许我们可以进一步迭代。

显示状态后

好吧,Handler_read_rnd_next说这是全表扫描。1000 和 1001——你有吗LIMIT 1000

我推断这LIMIT并不影响SPATIAL工作原理。也就是说,它执行简单的操作 - (1) 检查所有行,(2) 排序,(3) LIMIT

那么该怎么办?

计划 A:确定您不希望结果超过 X 英里 (km),并向查询添加“边界框”。

B 计划:放弃 Spatial 并深入研究更复杂的方法来完成任务: http: //mysql.rjweb.org/doc.php/latlng