Par*_*lia 5 mysql schema database-design database-schema
我有一个数据库表,维护一些信息,并需要保留订单.基本上如果我列出了元素1到5,并且我想添加一个新元素,那么它可以插入到现有行中的任何位置,可以是最后一个,5之后,1之前的开始或中间的某个位置,例如3之后有没有办法使用MySQL INSERT语句并指定我们应该在哪一行插入索引?
我认为不是.所以我的策略是创建另一个列'order_number',它基本上记录了元素的顺序.例如,如果记录表具有主键(record_id)和并排列出的order_number,它将如下所示:
record_id order_number
1 1
2 2
3 3
4 4
5 5
Run Code Online (Sandbox Code Playgroud)
要在第3行之后向此行添加新元素,生成的结束表将如下所示:
record_id order_number
1 1
2 2
3 3
**6** **4** <------ added row
4 **5** <-- changed order_number
5 **6** <-- changed order_number
Run Code Online (Sandbox Code Playgroud)
在这种情况下,我可以通过简单地选择我想要的数据并提供Order By order_number asc子句来清楚地实现我想要的顺序.
但是,正如您所看到的,要做一个简单的Insert,它需要我更新它之后出现的每个其他行的order_number.该表预计至少具有大量的行(大小为100,000),并且在每次单个插入操作时简单地更新每隔一行(因此锁定表)根本不可行.
在这种情况下,什么是更好的推荐策略?
ype*_*eᵀᴹ 15
如果order_number
不显示但仅用于排序,我建议您使用十进制数据类型而不是整数.这样,当您必须在两个现有行之间插入一行时,您可以将order_number设置为两个现有订单号的平均值.
在你的例子中:
record_id order_number
1 1.0
2 2.0
3 3.0
**6** 3.5 <---- added row
4 4.0 <-- no change
5 5.0 <-- no change
Run Code Online (Sandbox Code Playgroud)
但是有一个问题,如果你继续在同一区域插入数字,一些订单号可能会导致你选择的数据类型的精度太接近,足够接近以至于不能彼此区分.
为避免这种情况,您的插入程序必须检查两个现有订单号是否过于接近.在这种情况下,它可以重新分配其他附近行的一些订单号,"拉伸"上方和下方的订单号以"创建空间"以获得新值.
您还可以定期运行"清理"过程,并在表的整个或大部分中进行"拉伸".
我找到了一个类似问题的答案:https : //stackoverflow.com/a/6333717/1010050
总之,它将所有记录 ID 增加到您要添加的记录 ID 以下,以保持一致性。这仍然需要您更新所有记录 ID,因此它不是最有效的。与您的方法相比,它确实具有维护数据库中物理顺序的好处,而不仅仅是像您那样的虚拟顺序。
我能想到的另一种方法是记录每条记录的子记录和父记录 ID,而不是订单号,类似于双向链表。无论表大小如何,在中间插入一个元素只需要更新另外两条记录。这与您的解决方案具有相同的缺点,其中物理顺序是错误的,因此以有序方式从表中读取会更昂贵。
例如:
record_id parent_id child_id
0 NULL 1
1 0 2
2 1 NULL
Run Code Online (Sandbox Code Playgroud)
当我们在 之后插入一条记录时record_id = 1
,表变成:
record_id parent_id child_id
0 NULL 1
1 0 3
2 3 NULL
3 1 2
Run Code Online (Sandbox Code Playgroud)
注意如何只有parent_id
和child_id
对ID的1和2必须改变。
我认为在这两种解决方案之间,最需要考虑的是你最常见的操作是什么:按顺序读出值,或者在中间的某个地方写一个新值。如果它正在读取,那么更新记录 ID 将是您最好的选择,以维护数据库的物理顺序。如果写作,那么您可以使用我建议的类似于双向链表的方法或您自己的排序方法来优化它。
问题更新后总结: 看到更新大部分记录都不可行,那么我找到的另一个答案肯定是无效的。然而,将其处理为类似于双向链表的解决方案仍然是合理的。