LaB*_*cca 39 t-sql sql-server sql-server-2005
我需要对varchar(20)字段进行以下修改:
例如
'aèàç=.32s df'
Run Code Online (Sandbox Code Playgroud)
必须成为
'aeacsdf'
Run Code Online (Sandbox Code Playgroud)
是否有特殊的存储功能来轻松实现这一目标?
更新:请提供T-SQL而不是CLR解决方案.这是我临时做的解决方法,因为它暂时适合我的需求,无论如何使用更优雅的方法会更好.
CREATE FUNCTION sf_RemoveExtraChars (@NAME nvarchar(50))
RETURNS nvarchar(50)
AS
BEGIN
declare @TempString nvarchar(100)
set @TempString = @NAME
set @TempString = LOWER(@TempString)
set @TempString = replace(@TempString,' ', '')
set @TempString = replace(@TempString,'à', 'a')
set @TempString = replace(@TempString,'è', 'e')
set @TempString = replace(@TempString,'é', 'e')
set @TempString = replace(@TempString,'ì', 'i')
set @TempString = replace(@TempString,'ò', 'o')
set @TempString = replace(@TempString,'ù', 'u')
set @TempString = replace(@TempString,'ç', 'c')
set @TempString = replace(@TempString,'''', '')
set @TempString = replace(@TempString,'`', '')
set @TempString = replace(@TempString,'-', '')
return @TempString
END
GO
Run Code Online (Sandbox Code Playgroud)
Dom*_*let 101
实现这一目标的最佳方法是非常简单和有效:
SELECT 'àéêöhello!' Collate SQL_Latin1_General_CP1253_CI_AI
Run Code Online (Sandbox Code Playgroud)
输出'aeeohello!'
字符串不能是unicode.如果你有一个nvarchar,只需在使用整理之前将其强制转换为varchar.
这是一个满足OP需求的函数:
create function [dbo].[RemoveExtraChars] ( @p_OriginalString varchar(50) )
returns varchar(50) as
begin
declare @i int = 1; -- must start from 1, as SubString is 1-based
declare @OriginalString varchar(100) = @p_OriginalString Collate SQL_Latin1_General_CP1253_CI_AI;
declare @ModifiedString varchar(100) = '';
while @i <= Len(@OriginalString)
begin
if SubString(@OriginalString, @i, 1) like '[a-Z]'
begin
set @ModifiedString = @ModifiedString + SubString(@OriginalString, @i, 1);
end
set @i = @i + 1;
end
return @ModifiedString
end
Run Code Online (Sandbox Code Playgroud)
然后,命令:
select dbo.RemoveExtraChars('aèàç=.32s df')
Run Code Online (Sandbox Code Playgroud)
输出
aeacsdf
Run Code Online (Sandbox Code Playgroud)
jve*_*zey 16
您正在寻找的是从个别角色中删除变音符号的内容.我担心你的解决方案几乎和你能得到的一样好,至少对于纯SQL来说.但是dotNet/CLR确实提供了一种简单的方法.抱歉,我知道您要避免使用其他CLR解决方案,但Microsoft SQL Server不提供与此类似的T-SQL.
如果幸运的话,您将数据库中的排序规则设置为"SQL_Latin1_General_CP1_CI_AS"或以"SQL_Latin1_General"开头的任何变体.这相当于Windows-1252,它有很好的文档记录.通过查看字符并使用SQL CASE语句映射等效字符,您将能够将每个字符"翻译"为英语等效字符.
不过,我确实对您的代码进行了一次快速更正.您将要在变量和参数中使用varchar.它会产生额外的开销来回执行数据类型转换,并且有可能将仅作为unicode存在的unicode字符引入混合.此外,可以在Bruce Schneier的博客上找到与您的情况相关的安全相关原因.
更新有关变音符号和Windows国际化的一些重要信息可以在Michael S Kaplan的博客上找到.
小智 6
SELECT 'áéíóú' COLLATE Cyrillic_General_CI_AI
Run Code Online (Sandbox Code Playgroud)
这将取代所有重音字符......
结果:aeiou
希望这对你有所帮助!
首先让我澄清一下:你展示的重音字符实际上并不是Unicode(正如一个答案所暗示的); 这些是8位ASCII字符.要记住的一件事是:你看到像è和à这样的字符只是因为这是你的代码页(你的操作系统和/或SQL Server使用的代码页[我不确定哪一个])显示它们的方式.在不同的代码页中,这些字符将由完全不同的符号表示(例如,如果您使用西里尔语或土耳其语代码页).
无论如何,假设您想要使用与默认代码页最接近的美国/拉丁字符替换这些8位字符[我假设这些字符来自拉丁字符集的某些变体].这就是我处理类似问题的方法(免责声明:这不是一个非常优雅的解决方案,但我当时想不出更好的东西):
创建UDF以将8位ASCII字符转换为7位可打印ASCII等效字符,例如:
CREATE FUNCTION dbo.fnCharToAscii
(
@Char AS VARCHAR
)
RETURNS
VARCHAR
AS
BEGIN
IF (@Char IS NULL)
RETURN ''
-- Process control and DEL chars.
IF (ASCII(@Char) < 32) OR (ASCII(@Char) = 127)
RETURN ''
-- Return printable 7-bit ASCII chars as is.
-- UPDATE TO DELETE NON-ALPHA CHARS.
IF (ASCII(@Char) >= 32) AND (ASCII(@Char) < 127)
RETURN @Char
-- Process 8-bit ASCII chars.
RETURN
CASE ASCII(@Char)
WHEN 128 THEN 'E'
WHEN 129 THEN '?'
WHEN 130 THEN ','
WHEN 131 THEN 'f'
WHEN 132 THEN ','
WHEN 133 THEN '.'
WHEN 134 THEN '+'
WHEN 135 THEN '+'
WHEN 136 THEN '^'
WHEN 137 THEN '%'
WHEN 138 THEN 'S'
WHEN 139 THEN '<'
WHEN 140 THEN 'C'
WHEN 141 THEN '?'
WHEN 142 THEN 'Z'
WHEN 143 THEN '?'
WHEN 144 THEN '?'
WHEN 145 THEN ''''
WHEN 146 THEN ''''
WHEN 147 THEN '"'
WHEN 148 THEN '"'
WHEN 149 THEN '-'
WHEN 150 THEN '-'
WHEN 151 THEN '-'
WHEN 152 THEN '~'
WHEN 153 THEN '?'
WHEN 154 THEN 's'
WHEN 155 THEN '>'
WHEN 156 THEN 'o'
WHEN 157 THEN '?'
WHEN 158 THEN 'z'
WHEN 159 THEN 'Y'
WHEN 160 THEN ' '
WHEN 161 THEN 'i'
WHEN 162 THEN 'c'
WHEN 163 THEN 'L'
WHEN 164 THEN '?'
WHEN 165 THEN 'Y'
WHEN 166 THEN '|'
WHEN 167 THEN '$'
WHEN 168 THEN '^'
WHEN 169 THEN 'c'
WHEN 170 THEN 'a'
WHEN 171 THEN '<'
WHEN 172 THEN '-'
WHEN 173 THEN '-'
WHEN 174 THEN 'R'
WHEN 175 THEN '-'
WHEN 176 THEN 'o'
WHEN 177 THEN '+'
WHEN 178 THEN '2'
WHEN 179 THEN '3'
WHEN 180 THEN ''''
WHEN 181 THEN 'm'
WHEN 182 THEN 'P'
WHEN 183 THEN '-'
WHEN 184 THEN ','
WHEN 185 THEN '1'
WHEN 186 THEN '0'
WHEN 187 THEN '>'
WHEN 188 THEN '?'
WHEN 189 THEN '?'
WHEN 190 THEN '?'
WHEN 191 THEN '?'
WHEN 192 THEN 'A'
WHEN 193 THEN 'A'
WHEN 194 THEN 'A'
WHEN 195 THEN 'A'
WHEN 196 THEN 'A'
WHEN 197 THEN 'A'
WHEN 198 THEN 'A'
WHEN 199 THEN 'C'
WHEN 200 THEN 'E'
WHEN 201 THEN 'E'
WHEN 202 THEN 'E'
WHEN 203 THEN 'E'
WHEN 204 THEN 'I'
WHEN 205 THEN 'I'
WHEN 206 THEN 'I'
WHEN 207 THEN 'I'
WHEN 208 THEN 'D'
WHEN 209 THEN 'N'
WHEN 210 THEN 'O'
WHEN 211 THEN 'O'
WHEN 212 THEN 'O'
WHEN 213 THEN 'O'
WHEN 214 THEN 'O'
WHEN 215 THEN 'x'
WHEN 216 THEN 'O'
WHEN 217 THEN 'U'
WHEN 218 THEN 'U'
WHEN 219 THEN 'U'
WHEN 220 THEN 'U'
WHEN 221 THEN 'Y'
WHEN 222 THEN 'b'
WHEN 223 THEN 'B'
WHEN 224 THEN 'a'
WHEN 225 THEN 'a'
WHEN 226 THEN 'a'
WHEN 227 THEN 'a'
WHEN 228 THEN 'a'
WHEN 229 THEN 'a'
WHEN 230 THEN 'a'
WHEN 231 THEN 'c'
WHEN 232 THEN 'e'
WHEN 233 THEN 'e'
WHEN 234 THEN 'e'
WHEN 235 THEN 'e'
WHEN 236 THEN 'i'
WHEN 237 THEN 'i'
WHEN 238 THEN 'i'
WHEN 239 THEN 'i'
WHEN 240 THEN 'o'
WHEN 241 THEN 'n'
WHEN 242 THEN 'o'
WHEN 243 THEN 'o'
WHEN 244 THEN 'o'
WHEN 245 THEN 'o'
WHEN 246 THEN 'o'
WHEN 247 THEN '-'
WHEN 248 THEN 'o'
WHEN 249 THEN 'u'
WHEN 250 THEN 'u'
WHEN 251 THEN 'u'
WHEN 252 THEN 'u'
WHEN 253 THEN 'y'
WHEN 254 THEN 'b'
WHEN 255 THEN 'y'
END
RETURN ''
END
Run Code Online (Sandbox Code Playgroud)
上面的代码是通用的,因此您可以调整字符映射以删除所有非字母字符,例如,您可以在匹配可打印的7位ASCII字符时使用这样的代码(这假设不区分大小写的排序规则):
IF @Char NOT LIKE '[a-z]' RETURN ''
Run Code Online (Sandbox Code Playgroud)
要查看8位ASCII符号的字符映射是否正常工作,请运行以下代码:
DECLARE @I INT
DECLARE @Msg VARCHAR(32)
SET @I = 128
WHILE @I < 256
BEGIN
SELECT @Msg = CAST(@I AS VARCHAR) +
': ' +
CHAR(@I) +
'=' +
dbo.fnCharToAscii(CHAR(@I))
PRINT @Msg
SET @I = @I + 1
END
Run Code Online (Sandbox Code Playgroud)
现在您可以创建一个UDF来处理字符串:
CREATE FUNCTION dbo.fnStringToAscii
(
@Value AS VARCHAR(8000)
)
RETURNS
VARCHAR(8000)
AS
BEGIN
IF (@Value IS NULL OR DATALENGTH(@Value) = 0)
RETURN ''
DECLARE @Index INT
DECLARE @Result VARCHAR(8000)
SET @Result = ''
SET @Index = 1
WHILE (@Index <= DATALENGTH(@Value))
BEGIN
SET @Result = @Result + dbo.fnCharToAscii(SUBSTRING(@Value, @Index, 1))
SET @Index = @Index + 1
END
RETURN @Result
END
GO
Run Code Online (Sandbox Code Playgroud)
REPLACE您可以通过使用COLLATE具有不区分重音的排序规则的子句来将重音字母字符与非字母字符进行比较,从而避免硬编码语句:
DECLARE \n @s1 NVARCHAR(200),\n @s2 NVARCHAR(200)\n\nSET @s1 = N'a\xc3\xa8\xc3\xa0\xc3\xa7=.32s df' \n\nSET @s2 = N''\nSELECT @s2 = @s2 + no_accent \nFROM ( \n SELECT \n SUBSTRING(@s1, number, 1) AS accent,\n number\n FROM master.dbo.spt_values \n WHERE TYPE = 'P'\n AND number BETWEEN 1 AND LEN(@s1) \n) s1 \nINNER JOIN (\n SELECT NCHAR(number) AS no_accent\n FROM master.dbo.spt_values \n WHERE type = 'P'\n AND (number BETWEEN 65 AND 90 OR number BETWEEN 97 AND 122) \n) s2 \n ON s1.accent COLLATE LATIN1_GENERAL_CS_AI = s2.no_accent \nORDER BY number\n\nSELECT @s1 \nSELECT @s2 \n\n/*\na\xc3\xa8\xc3\xa0\xc3\xa7=.32s df\naeacsdf\n*/\nRun Code Online (Sandbox Code Playgroud)\n
| 归档时间: |
|
| 查看次数: |
79790 次 |
| 最近记录: |