我正在使用C#TextFieldParser类处理CSV解析器.
我的CSV数据被消除,,字符串由"字符包围.
但是,有时数据行单元格也可能有一个"似乎使解析器抛出异常.

到目前为止,这是我的C#代码:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.IO;
using Microsoft.VisualBasic.FileIO;
namespace CSV_Parser
{
class Program
{
static void Main(string[] args)
{
// Init
string CSV_File = "test.csv";
// Proceed If File Is Found
if (File.Exists(CSV_File))
{
// Test
Parse_CSV(CSV_File);
}
// Finished
Console.WriteLine("Press any to exit ...");
Console.ReadKey();
}
static void Parse_CSV(String Filename)
{
using (TextFieldParser parser = new TextFieldParser(Filename))
{
parser.TextFieldType = FieldType.Delimited;
parser.SetDelimiters(",");
parser.TrimWhiteSpace = true;
while (!parser.EndOfData)
{
string[] fieldRow = parser.ReadFields();
foreach (string fieldRowCell in fieldRow)
{
// todo
}
}
}
}
}
}
Run Code Online (Sandbox Code Playgroud)
这是我test.csv文件的内容:
" dummy test"s data", b , c
d,e,f
gh,ij
Run Code Online (Sandbox Code Playgroud)
"在我的行单元数据中处理的最佳方法是什么?
UPDATE
根据Tim Schmelter's答案,我已将我的代码修改为以下内容:
static void Parse_CSV(String Filename)
{
using (TextFieldParser parser = new TextFieldParser(Filename))
{
parser.TextFieldType = FieldType.Delimited;
parser.SetDelimiters(",");
parser.HasFieldsEnclosedInQuotes = false;
parser.TrimWhiteSpace = true;
while (parser.PeekChars(1) != null)
{
var cleanFieldRowCells = parser.ReadFields().Select(
f => f.Trim(new[] { ' ', '"' }));
Console.WriteLine(String.Join(" | ", cleanFieldRowCells));
}
}
}
Run Code Online (Sandbox Code Playgroud)
这似乎产生以下(正确):

这是处理引号括起来的字符串,有引号的最佳方法吗?
您可以通过将设置HasFieldsEnclosedInQuotes为来省略引号false吗?
using (var parser = new TextFieldParser(@"Path"))
{
parser.HasFieldsEnclosedInQuotes = false;
parser.Delimiters = new[]{","};
while(parser.PeekChars(1) != null)
{
string[] fields = parser.ReadFields();
}
}
Run Code Online (Sandbox Code Playgroud)
您可以手动删除引号:
var cleanFields = fields.Select(f => f.Trim(new[]{ ' ', '"' }));
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
32878 次 |
| 最近记录: |