SINGLE_NCLOB 需要一个 UNICODE (widechar) 输入文件

Question

SINGLE_NCLOB 需要一个 UNICODE (widechar) 输入文件

我遵循了这个过程：

打开记事本并输入一些文本：“Hello World”
将ansi文件保存为：c:\HelloWorld.txt

然后我运行以下查询：

select * from openrowset(bulk 'C:\HelloWorld.txt',single_clob) as test

Run Code Online (Sandbox Code Playgroud)

文本出现在名为：的列中BulkColumn。

然后我这样做：

打开记事本并输入一些文本：“Hello World”
将 unicode 文件保存为：c:\HelloWorld.txt

然后我运行以下查询：

select * from openrowset(bulk N'C:\HelloWorld.txt',single_nclob) as test

Run Code Online (Sandbox Code Playgroud)

我得到的错误是：

SINGLE_NCLOB 需要一个 UNICODE (widechar) 输入文件。指定的文件不是 Unicode。

为什么是这样？

Answer 1

Sol*_*zky 6

您需要仔细检查您是如何保存“Unicode”文件的。在 Windows / .NET / SQL Server 中，术语“Unicode”特指“UTF-16 Little Endian (LE)”。在处理 UTF-16 Big Endian (BE) 时，它将被称为“Unicode Big Endian”或“Big Endian Unicode”。UTF-8 始终是 UTF-8。

我在记事本中创建了一个文件，然后转到“另存为”并从“编码”下拉列表中选择了“Unicode”，它与您正在使用的语句配合得很好：

SELECT *
FROM OPENROWSET(BULK N'C:\temp\OPENROWSET_BULK_NCLOB-test.txt', SINGLE_NCLOB) AS [Test];

Run Code Online (Sandbox Code Playgroud)

如果我用任何其他编码重新保存它，我会收到您看到的错误消息。

我还使用了 Notepad++，并在“编码”菜单中选择了“在 UCS-2 Little Endian 中编码”。UCS-2 和 UTF-16 对于代码点 U+0000 到 U+FFFF 是相同的，并且 Notepad++ 中没有 UTF-16 选项，所以这是最接近的。是的，它也有效。

所以不知何故你实际上并没有将文件保存为“Unicode”。如果您在记事本中选择了“Unicode big endian”，就 Windows 使用该术语的方式而言，这不是“Unicode”，即使它是有效的 Unicode 编码。

归档时间：	10 年前
查看次数：	4104 次
最近记录：	10 年前