解析没有字符串拆分

Vla*_*lad 6 c# parsing

这是其他问题讨论的衍生产品.

假设我必须解析大量非常长的字符串.每个字符串包含一个double由空格分隔的s 序列(当然是文本表示).我需要将doubles 解析成一个List<double>.

标准的解析技术(使用string.Split+ double.TryParse)似乎很慢:对于每个我们需要分配字符串的数字.

我试图使它成为旧C类的方式:计算包含数字的子串的开始和结束的索引,并在"就地"解析它,而不创建额外的字符串.(见http://ideone.com/Op6h0,下面显示了相关部分.)

int startIdx, endIdx = 0;
while(true)
{
    startIdx = endIdx;
    // no find_first_not_of in C#
    while (startIdx < s.Length && s[startIdx] == ' ') startIdx++;
    if (startIdx == s.Length) break;
    endIdx = s.IndexOf(' ', startIdx);
    if (endIdx == -1) endIdx = s.Length;
    // how to extract a double here?
}
Run Code Online (Sandbox Code Playgroud)

有一个重载string.IndexOf,只在给定的子字符串中搜索,但是我找不到从子字符串解析double的方法,而没有先实际提取该子字符串.

有没有人有想法?

usr*_*usr 7

没有管理API从子解析双.我的猜测是,与double.Parse中的所有浮点运算相比,分配字符串将是无关紧要的.

无论如何,您可以通过创建长度为100的"缓冲区"字符串来保存分配,该字符串仅包含空格.然后,对于要解析的每个字符串,使用不安全的代码将字符复制到此缓冲区字符串中.用空格填充缓冲区字符串.对于解析,您可以使用NumberStyles.AllowTrailingWhite,这将导致尾随空格被忽略.

获取指向字符串的指针实际上是一个完全支持的操作:

    string l_pos = new string(' ', 100); //don't write to a shared string!
    unsafe 
    {
        fixed (char* l_pSrc = l_pos)
        {               
              // do some work
        }
    }
Run Code Online (Sandbox Code Playgroud)

C#具有将字符串绑定到char*的特殊语法.

  • StringBuilder cnanot用于解析double.当您调用ToString时,StringBuilders内部缓冲区字符串将被重置(如果不是,您可以追溯性地修改传递给应用程序的字符串).出于同样的原因,StringBuilder是线程安全的. (2认同)