我希望在表中找到与用户输入的特定号码匹配的记录.因此,用户可以输入12345,但这可能是数据库中的123zz4-5.
如果PHP函数在MySQL中运行,我想像这样的东西会起作用.
SELECT * FROM foo WHERE preg_replace("/[^0-9]/","",bar) = '12345'
Run Code Online (Sandbox Code Playgroud)
只用MySQL做同样的功能或方法是什么?
小智 40
我意识到这是一个古老的话题,但谷歌搜索这个问题我找不到一个简单的解决方案(我看到了古老的代理人,但认为这是一个更简单的解决方案)所以这是我写的一个函数,似乎工作得很好.
DROP FUNCTION IF EXISTS STRIP_NON_DIGIT;
DELIMITER $$
CREATE FUNCTION STRIP_NON_DIGIT(input VARCHAR(255))
RETURNS VARCHAR(255)
BEGIN
DECLARE output VARCHAR(255) DEFAULT '';
DECLARE iterator INT DEFAULT 1;
WHILE iterator < (LENGTH(input) + 1) DO
IF SUBSTRING(input, iterator, 1) IN ( '0', '1', '2', '3', '4', '5', '6', '7', '8', '9' ) THEN
SET output = CONCAT(output, SUBSTRING(input, iterator, 1));
END IF;
SET iterator = iterator + 1;
END WHILE;
RETURN output;
END
$$
Run Code Online (Sandbox Code Playgroud)
在 MySQL 8.0+ 上有一个新的本机函数,称为 REGEXP_REPLACE。这个问题的一个干净的解决方案是:
SELECT * FROM foo WHERE REGEXP_REPLACE(bar,'[^0-9]+',"") = '12345'
Run Code Online (Sandbox Code Playgroud)
没有regexp替换,只有一个普通的字符串REPLACE().
MySQL有REGEXP运算符,但它只是一个匹配测试程序而不是一个替换程序,所以你必须从内到外打开逻辑:
SELECT * FROM foo WHERE bar REGEXP '[^0-9]*1[^0-9]*2[^0-9]*3[^0-9]*4[^0-9]*5[^0-9]*';
Run Code Online (Sandbox Code Playgroud)
这就像你的LIKE版本,但更准确地匹配.两者都表现同样糟糕,需要没有索引的全表扫描.
最受欢迎的答案(@ user1467716)并不是最快的.对他们给予工作建议反弹的全部赞誉!
这是一个改进版本:
DELIMITER ;;
DROP FUNCTION IF EXISTS `STRIP_NON_DIGIT`;;
CREATE DEFINER=`root`@`localhost` FUNCTION `STRIP_NON_DIGIT`(input VARCHAR(255)) RETURNS VARCHAR(255) CHARSET utf8
READS SQL DATA
BEGIN
DECLARE output VARCHAR(255) DEFAULT '';
DECLARE iterator INT DEFAULT 1;
DECLARE lastDigit INT DEFAULT 1;
DECLARE len INT;
SET len = LENGTH(input) + 1;
WHILE iterator < len DO
-- skip past all digits
SET lastDigit = iterator;
WHILE ORD(SUBSTRING(input, iterator, 1)) BETWEEN 48 AND 57 AND iterator < len DO
SET iterator = iterator + 1;
END WHILE;
IF iterator != lastDigit THEN
SET output = CONCAT(output, SUBSTRING(input, lastDigit, iterator - lastDigit));
END IF;
WHILE ORD(SUBSTRING(input, iterator, 1)) NOT BETWEEN 48 AND 57 AND iterator < len DO
SET iterator = iterator + 1;
END WHILE;
END WHILE;
RETURN output;
END;;
Run Code Online (Sandbox Code Playgroud)
在测试服务器上测试5000次:
-- original
Execution Time : 7.389 sec
Execution Time : 7.257 sec
Execution Time : 7.506 sec
-- ORD between not string IN
Execution Time : 4.031 sec
-- With less substrings
Execution Time : 3.243 sec
Execution Time : 3.415 sec
Execution Time : 2.848 sec
Run Code Online (Sandbox Code Playgroud)
虽然它不漂亮并且显示的结果不匹配,但这有助于:
SELECT * FROM foo WHERE bar LIKE = '%1%2%3%4%5%'
Run Code Online (Sandbox Code Playgroud)
我仍然希望找到一个更好的解决方案,类似于原始问题中的项目.
您可以轻松地完成所需的操作REGEXP_REPLACE(与MySQL 8+和MariaDB 10.0.5+兼容)
REGEXP_REPLACE(expr, pat, repl[, pos[, occurrence[, match_type]]])用替换字符串repl替换字符串expr中与模式pat指定的正则表达式匹配的匹配项,并返回结果字符串。如果expr,pat或repl为NULL,则返回值为NULL。
试试吧:
SELECT REGEXP_REPLACE('123asd12333', '[a-zA-Z]+', '');
Run Code Online (Sandbox Code Playgroud)
输出:
12312333
Run Code Online (Sandbox Code Playgroud)
我能想到的最简单的方法是使用 MySQL REGEXP 运算符:
WHERE foo LIKE '1\D*2\D*3\D*4\D*5'
Run Code Online (Sandbox Code Playgroud)
它不是特别漂亮,但 MySQL 没有函数preg_replace,所以我认为这是你能得到的最好的。
就我个人而言,如果这个纯数字数据如此重要,我会保留一个单独的字段来包含剥离的数据。它将使您的查找比正则表达式搜索快得多。