Mar*_*aac 5 regex sql postgresql group-by sql-order-by
我在表中有以下值:
表水果
id | name | price
-----------------------------------------
1 | 'APPLE BANANA ORANGE' | 12.00
2 | 'BANANA ORANGE APPLE' | 4.00
3 | 'ORANGE APPLE BANANA' | 10.00
4 | 'LEMON APPLE BANANA ORANGE' | 7.00
5 | 'APPLE LEMON BANANA ORANGE' | 8.00
Run Code Online (Sandbox Code Playgroud)
我想选择3个第一行的所有值,而我只有一个包含'APPLE BANANA ORANGE'的文本
例
SELECT *
FROM fruits
WHERE name IN
('APPLE BANANA ORANGE','BANANA ORANGE APPLE','ORANGE APPLE BANANA')
Run Code Online (Sandbox Code Playgroud)
问题是这些值来自另一个表,我正在寻找一种方法来生成可能值的不同组合
也许使用一个函数:
SELECT *
FROM fruits f
INNER JOIN order o ON o.name IN some_function(f.name)
Run Code Online (Sandbox Code Playgroud)
也许使用一些正则表达式:
SELECT *
FROM fruits f
INNER JOIN order o ON o.name ~ '(?=' || f.name || ')'
Run Code Online (Sandbox Code Playgroud)
我试图使用在互联网上找到的一些使用环视的正则表达式,它们带来包含这三个单词的所有值,但包括也有更多单词的单词.喜欢'LEMON APPLE BANANA ORANGE'和'APPLE LEMON BANANA ORANGE'
另一件事是我想将这些结果分组,无论它们出现的顺序如何
SELECT sum(price)
FROM fruits f
INNER JOIN order o ON o.name ~ '(?=' || f.name || ')'
GROUP BY somefunction(name);
Run Code Online (Sandbox Code Playgroud)
谢谢你的帮助
马塞尔·艾萨克
UPDATE
我创建了一个函数来分割字符串的内容,对单词进行排序并返回带有序字的新字符串
CREATE OR REPLACE FUNCTION order_words(txt character varying)
returns character varying as
$BODY$
DECLARE
tmp character varying;
BEGIN
SELECT string_agg(t,' ')
INTO tmp
FROM (
SELECT rstt
FROM regexp_split_to_table(txt, ' ') rstt
ORDER BY rstt) t;
RETURN tmp;
END;
$BODY$
LANGUAGE plpgsql VOLATILE
COST 100;
Run Code Online (Sandbox Code Playgroud)
在值上执行时,它始终返回相同的字符串
select order_words('APPLE BANANA ORANGE');
order_words
---------------------
APPLE BANANA ORANGE
(1 row)
select order_words('BANANA ORANGE APPLE');
order_words
---------------------
APPLE BANANA ORANGE
(1 row)
select order_words('ORANGE APPLE BANANA');
order_words
---------------------
APPLE BANANA ORANGE
(1 row)
Run Code Online (Sandbox Code Playgroud)
现在我可以编写我的代码了
SELECT order_words(name),sum(price)
FROM fruits f
INNER JOIN order o ON order_words(o.name) = order_words(f.name)
GROUP BY order_words(name);
Run Code Online (Sandbox Code Playgroud)
我会测试性能
小智 1
不确定这是否比您的解决方案更快:
select f.*
from fruits f
join orders o
on string_to_array(f.name, ' ') @> string_to_array(o.name, ' ')
and cardinality(string_to_array(f.name, ' ')) = cardinality(string_to_array(o.name, ' '));
Run Code Online (Sandbox Code Playgroud)
这个想法是将两个值分成数组并检查它们是否重叠。但因为“重叠”并不意味着所有元素都相等,所以我也比较了数组的长度。如果它们长度相等并且重叠,则所有元素都相等。
表达式string_to_array(f.name, ' ')可以被索引,并且运算符甚至可以使用 GIN 索引@>。
| 归档时间: |
|
| 查看次数: |
693 次 |
| 最近记录: |