在SQL Server中给定行分隔符和列分隔符的情况下将字符串拆分为表

Prz*_*min 10 sql sql-server string split

如何在SQL Server中将包含矩阵的字符串拆分为表?String具有列和行分隔符.

假设我有一个字符串:

declare @str varchar(max)='A,B,C;D,E,F;X,Y,Z';
Run Code Online (Sandbox Code Playgroud)

预期结果(分三列):

+---+---+---+
| A | B | C |
+---+---+---+
| D | E | F |
+---+---+---+
| X | Y | Z |
+---+---+---+
Run Code Online (Sandbox Code Playgroud)

我正在寻找没有定义列数和行数的通用解决方案.所以字符串:

declare @str varchar(max)='A,B;D,E';
Run Code Online (Sandbox Code Playgroud)

将分为两列的表格:

+---+---+
| A | B |
+---+---+
| D | E |
+---+---+
Run Code Online (Sandbox Code Playgroud)

我的努力.我的第一个想法是使用动态SQL将字符串转换为: insert into dbo.temp values (...)这种方法虽然非常快,但有一个小缺点,因为它需要先创建一个具有正确列数的表.我在下面回答我自己的问题时提出了这个方法,只是为了让问题简短.

另一个想法是将字符串写入服务器上的CSV文件,然后bulk insert从中写入.虽然我不知道该怎么做以及第一和第二个想法会有什么表现.

我问这个问题的原因是因为我想将数据从Excel导入到SQL Server.由于我已经尝试了不同的ADO方法,这种发送矩阵串的方法是一种压倒性的胜利,特别是当字符串的长度增加时.我问这个问题的小弟弟:将Excel范围转换为VBA字符串 ,在那里你可以找到如何从Excel范围准备这样一个字符串的建议.

赏金我决定奖励马特.我高度评价肖恩兰格的 答案.谢谢肖恩.我喜欢Matt的简单和简洁的答案.除了Matt和Sean之外的其他方法可以并行使用,所以暂时我不接受任何答案(更新:最后,几个月之后,我接受了Matt的回答).我要感谢Ahmed Saeed对VALUES的看法,因为这是我开始的答案的一个很好的演变.当然,这与马特或肖恩不匹配.我赞成了每一个答案.我将非常感谢您对使用这些方法的任何反馈.谢谢你的追求.

Sea*_*nge 6

好的,这个谜题引起了我的兴趣,所以我决定看看能不做任何循环就可以做到这一点.这有两个先决条件.首先,我们假设您有某种计数表.如果你没有,那么这是我的代码.我把它放在我使用的每个系统上.

create View [dbo].[cteTally] as

WITH
    E1(N) AS (select 1 from (values (1),(1),(1),(1),(1),(1),(1),(1),(1),(1))dt(n)),
    E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
    E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
    cteTally(N) AS 
    (
        SELECT  ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
    )
select N from cteTally
Run Code Online (Sandbox Code Playgroud)

这个难题的第二部分需要一个基于集合的字符串分割器.我对此的偏好是超级快速的Jeff Moden分离器.需要注意的是,它只适用于最多8,000的varchar值.这适用于我使用的大多数分隔字符串.你可以在这里找到Jeff Moden的分离器(DelimitedSplit8K).

http://www.sqlservercentral.com/articles/Tally+Table/72993/

最后但并非最不重要的是,我在这里使用的技术是动态交叉表.这是我从Jeff Moden那里学到的东西.他在这里有一篇很棒的文章.

http://www.sqlservercentral.com/articles/Crosstab/65048/

将所有这些放在一起你就可以得到类似的东西,它会非常快并且可以很好地扩展.

declare @str varchar(max)='A,B,C;D,E,F;X,Y,Z';

declare @StaticPortion nvarchar(2000) = 
'declare @str varchar(max)=''' + @str + ''';with OrderedResults as
    (
        select s.ItemNumber
            , s.Item as DelimitedValues
            , x.ItemNumber as RowNum
            , x.Item
        from dbo.DelimitedSplit8K(@str, '';'') s
        cross apply dbo.DelimitedSplit8K(s.Item, '','') x
    )
    select '

declare @DynamicPortion nvarchar(max) = '';
declare @FinalStaticPortion nvarchar(2000) = ' from OrderedResults group by ItemNumber';

select @DynamicPortion = @DynamicPortion + 
    ', MAX(Case when RowNum = ' + CAST(N as varchar(6)) + ' then Item end) as Column' + CAST(N as varchar(6)) + CHAR(10)
from cteTally t
where t.N <= (select MAX(len(Item) - LEN(replace(Item, ',', ''))) + 1
                from dbo.DelimitedSplit8K(@str, ';')
            )

declare @SqlToExecute nvarchar(max) = @StaticPortion + stuff(@DynamicPortion, 1, 1, '') + @FinalStaticPortion
exec sp_executesql @SqlToExecute
Run Code Online (Sandbox Code Playgroud)

- 编辑 -

如果链接无效,这是DelimitedSplit8K函数.

ALTER FUNCTION [dbo].[DelimitedSplit8K]
--===== Define I/O parameters
        (@pString VARCHAR(8000), @pDelimiter CHAR(1))
RETURNS TABLE WITH SCHEMABINDING AS
 RETURN
--===== "Inline" CTE Driven "Tally Table" produces values from 0 up to 10,000...
     -- enough to cover VARCHAR(8000)
  WITH E1(N) AS (
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
                ),                          --10E+1 or 10 rows
       E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
       E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
 cteTally(N) AS (--==== This provides the "zero base" and limits the number of rows right up front
                     -- for both a performance gain and prevention of accidental "overruns"
                 SELECT 0 UNION ALL
                 SELECT TOP (DATALENGTH(ISNULL(@pString,1))) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
                ),
cteStart(N1) AS (--==== This returns N+1 (starting position of each "element" just once for each delimiter)
                 SELECT t.N+1
                   FROM cteTally t
                  WHERE (SUBSTRING(@pString,t.N,1) = @pDelimiter OR t.N = 0) 
                )
--===== Do the actual split. The ISNULL/NULLIF combo handles the length for the final element when no delimiter is found.
 SELECT ItemNumber = ROW_NUMBER() OVER(ORDER BY s.N1),
        Item       = SUBSTRING(@pString,s.N1,ISNULL(NULLIF(CHARINDEX(@pDelimiter,@pString,s.N1),0)-s.N1,8000))
   FROM cteStart s
;
Run Code Online (Sandbox Code Playgroud)


Mat*_*att 5

一种更简单的方法是根据替换分隔符将字符串转换为XML.

declare @str varchar(max)='A,B,C;D,E,F;X,Y,Z';
DECLARE @xmlstr XML
SET @xmlstr = CAST(('<rows><row><col>' + REPLACE(REPLACE(@str,';','</col></row><row><col>'),',','</col><col>') + '</col></row></rows>') AS XML)

SELECT
    t.n.value('col[1]','CHAR(1)') as Col1
    ,t.n.value('col[2]','CHAR(1)') as Col2
    ,t.n.value('col[3]','CHAR(1)') as Col3
FROM
    @xmlstr.nodes ('/rows/row') AS t(n)
Run Code Online (Sandbox Code Playgroud)
  • 将字符串格式化为XML <rows><row><col></col><col></col></row><row><col></col><col></col></row></rows> 基本上,您需要添加开始和结束标记,然后使用列标记替换列分隔符,使用列标记和行标记替换行分隔符
  • .nodes是xml数据类型的一种方法,"当您想将xml数据类型实例分解为关系数据时非常有用" https://msdn.microsoft.com/en-us/library/ms188282.aspx
  • as t(n)告诉您如何最终访问XML行和列.t是表别名,n是节点别名(类似于行).所以tnvalue()得到一个特定的行
  • COL[1]意味着得到COL它基于1的行中的第一个标记,所以2是下一个,然后是3等.
  • CHAR(1)是一个数据类型定义,意思是1个字符,基于您的示例数据,每列只有1个字符.您可能已经注意到我VARCHAR(MAX)在动态查询中创建了它,因为如果数据类型未知,那么您将需要更多的灵活性.

或动态

DECLARE @str varchar(max)='A,B,C,D,E;F,G,H,I,J;K,L,M,N,O';
DECLARE @NumOfColumns INT
SET @NumOfColumns = (LEN(@str) - LEN(REPLACE(@str,',',''))) / (LEN(@str) - LEN(REPLACE(@str,';','')) + 1) + 1

DECLARE @xmlstr XML
SET @xmlstr = CAST(('<rows><row><col>' + REPLACE(REPLACE(@str,';','</col></row><row><col>'),',','</col><col>') + '</col></row></rows>') AS XML)

DECLARE @ParameterDef NVARCHAR(MAX) = N'@XMLInputString xml'
DECLARE @SQL NVARCHAR(MAX) = 'SELECT '

DECLARE @i INT = 1

WHILE @i <= @NumOfColumns
BEGIN
    SET @SQL = @SQL + IIF(@i > 1,',','') + 't.n.value(''col[' + CAST(@i AS VARCHAR(10)) + ']'',''NVARCHAR(MAX)'') as Col' + CAST(@i AS VARCHAR(10))

    SET @i = @i + 1
END

SET @SQL = @SQL + ' FROM
    @XMLInputString.nodes (''/rows/row'') AS t(n)'

EXECUTE sp_executesql @SQL,@ParameterDef,@XMLInputString = @xmlstr
Run Code Online (Sandbox Code Playgroud)