新的字符串类型如何在Delphi 2009/2010中工作?

Dan*_*ski 7 delphi string unicode delphi-2009

我必须将大型遗留应用程序转换为Delphi 2009,它使用字符串,AnsiStrings,WideStrings和UTF8数据,我很难理解新字符串类型的工作原理以及如何使用它们.

该应用程序完全支持使用TntUnicodeControls的Unicode,并且有第三方DLL需要特定编码的字符串,主要是UTF8和UTF16,这使得转换任务不像人们所怀疑的那样微不足道.

我特别遇到C DLL调用和选择正确类型的问题.我还得到了许多隐式字符串转换的印象,因为无论Delphi字符串是如何编码的,其中一个DLL似乎总是接收UTF-8编码的字符串.

有人可以提供关于新的Delphi 2009字符串类型UnicodeString和RawByteString的简短概述,可能是转换2009年前应用程序时的一些使用提示和可能的陷阱吗?

Eug*_*ota 11

请参阅Delphi和Unicode,这是由MarcoCantù撰写的白皮书,我猜 绝对最低,每个软件开发人员都必须完全知道关于Unicode和字符集(没有借口!),由Joel编写.

一个缺陷是默认的Win32 API调用已被映射为使用W(宽字符串)版本而不是A(ANSI)版本,例如,ShellExecuteA如果您的代码在假设内部布局的情况下做了棘手的指针代码AnsiString,它将会中断.后备广告是取代PCharPAnsiChar,CharAnsiChar,stringAnsiString和在Win32 API调用用于代码部分的端部追加.代码实际编译并正常运行后,您可以重构代码以使用string(UnicodeString).


Jer*_*ers 8

观看我的CodeRage 4关于本周五 "在您的程序中使用Unicode和其他编码"的演讲,或者等到它的重播在线提供.

我将介绍一些编码并解释字符串格式.

这些幻灯片很快就会上市(我今天会尝试将它们联机)并且包含很多你应该在互联网上阅读的内容(但我必须承认我忘记了eed3si9n发布的Unicode上的Joel链接).

今天将使用上传和链接编辑此答案.


编辑:

如果您有一个小样本,您可以在其中显示您的C/C++ DLL接收UTF8编码的字符串,但认为它们应该以其他方式进行编码,请发布它(邮寄给我;几乎所有在plumers dot com的内容都会发给我,特别是如果你在at符号前使用我的名字).

现在可以下载会话材料,包括"在程序中使用Unicode和其他编码"会话.

这些是该会话的链接:

阅读这些:

  1. Marco Cantu,白皮书" Delphi和Unicode "
  2. Marco Cantu,演讲" Delphi和Unicode "
  3. Nick Hodges,白皮书" Unicode世界中的Delphi "

相关的在线帮助主题:

  1. Delphi和C++ Builder 2009中的新功能
  2. 字符串类型:Base:ShortString,AnsiString,WideString,UnicodeString
  3. 字符串类型:Unicode(包括字符串类型的内部存储器布局)
  4. 字符串类型:启用Unicode
  5. 字符串类型:RawByteString(带有CodePage $ ffff的AnsiString)
  6. 字符串类型:UTF8String(带有CodePage 65001的AnsiString)
  7. 字符串< - > PChar转换:PChar基础
  8. 字符串< - > PChar转换:返回PChar局部变量
  9. 字符串< - > PChar转换:将局部变量作为PChar传递

希望这能让你前进.如果没有,请给我发邮件,我会尽力扩展答案.