SINGLE_NCLOB 需要一个 UNICODE (widechar) 输入文件

w00*_*977 3 sql sql-server unicode

我遵循了这个过程:

  1. 打开记事本并输入一些文本:“Hello World”
  2. 将ansi文件保存为:c:\HelloWorld.txt

然后我运行以下查询:

select * from openrowset(bulk 'C:\HelloWorld.txt',single_clob) as test
Run Code Online (Sandbox Code Playgroud)

文本出现在名为: 的列中BulkColumn

然后我这样做:

  1. 打开记事本并输入一些文本:“Hello World”
  2. 将 unicode 文件保存为:c:\HelloWorld.txt

然后我运行以下查询:

select * from openrowset(bulk N'C:\HelloWorld.txt',single_nclob) as test
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

SINGLE_NCLOB 需要一个 UNICODE (widechar) 输入文件。指定的文件不是 Unicode。

为什么是这样?

Sol*_*zky 6

您需要仔细检查您是如何保存“Unicode”文件的。在 Windows / .NET / SQL Server 中,术语“Unicode”特指“UTF-16 Little Endian (LE)”。在处理 UTF-16 Big Endian (BE) 时,它将被称为“Unicode Big Endian”或“Big Endian Unicode”。UTF-8 始终是 UTF-8。

我在记事本中创建了一个文件,然后转到“另存为”并从“编码”下拉列表中选择了“Unicode”,它与您正在使用的语句配合得很好:

SELECT *
FROM OPENROWSET(BULK N'C:\temp\OPENROWSET_BULK_NCLOB-test.txt', SINGLE_NCLOB) AS [Test];
Run Code Online (Sandbox Code Playgroud)

如果我用任何其他编码重新保存它,我会收到您看到的错误消息。

我还使用了 Notepad++,并在“编码”菜单中选择了“在 UCS-2 Little Endian 中编码”。UCS-2 和 UTF-16 对于代码点 U+0000 到 U+FFFF 是相同的,并且 Notepad++ 中没有 UTF-16 选项,所以这是最接近的。是的,它也有效。

所以不知何故你实际上并没有将文件保存为“Unicode”。如果您在记事本中选择了“Unicode big endian”,就 Windows 使用该术语的方式而言,这不是“Unicode”,即使它是有效的 Unicode 编码。