我正在使用Lumenworks Fast CsvReader,并且在阅读Kelley Blue Book的文件时发生了异常错误:
在位于'1169'的记录'1281'字段'5附近,CSV似乎已损坏
该文件以制表符分隔.在那里我发现使用双引号,但我没有看到如何逃避它并正常恢复,因为它是制表符分隔数据.
--Characters in Text File--
12345 2013 RAV4 "Sport" Sport Utility 4D 2
--Source Code--
using(CsvReader csvReader = new CsvReader(new StreamReader(filePath), false, '\t', '"', '"', '#', LumenWorks.Framework.IO.Csv.ValueTrimmingOptions.QuotedOnly))
{
}
Run Code Online (Sandbox Code Playgroud)
我尝试了许多不同的CsvReader设置而没有运气.你用的是什么效果很好?我用逗号分隔文件没有那么多麻烦.
在后面有一个mssing关闭支架StreamReader:
using (CsvReader csvReader = new CsvReader(new StreamReader(filePath), false, '\t', '"', '"', '#', LumenWorks.Framework.IO.Csv.ValueTrimmingOptions.All))
{
int fieldCount = csvReader.FieldCount;
while (csvReader.ReadNextRecord())
{
for (int i = 0; i < fieldCount; i++)
Console.WriteLine("Column {0}: {1}", i + 1, csvReader[i]);
}
}
Run Code Online (Sandbox Code Playgroud)
我已经用上面的行测试了它(强制标签作为文件中的分隔符)并且它有效.
产出是:
Column 1: 12345
Column 2: 2013
Column 3: RAV4
Column 4: Sport
Column 5: Sport Utility
Column 6: 4D
Column 7: 2
Run Code Online (Sandbox Code Playgroud)
更新,根据您的意见和提供的文本文件:
这个CSV阅读器能够处理FillError,并ParseError通过无效或损坏数据引发的异常.因此,您可以处理它们以获取更多信息并用于记录目的.
例如:
void csv_ParseError(object sender, ParseErrorEventArgs e)
{
// if the error is that a field is missing, then skip to next line
if (e.Error is MissingFieldCsvException)
{
//Log.Write(e.Error, "--MISSING FIELD ERROR OCCURRED!" + Environment.NewLine);
e.Action = ParseErrorAction.AdvanceToNextLine;
}
else if (e.Error is MalformedCsvException)
{
//Log.Write(e.Error, "--MALFORMED CSV ERROR OCCURRED!" + Environment.NewLine);
e.Action = ParseErrorAction.AdvanceToNextLine;
}
else
{
//Log.Write(e.Error, "--UNKNOWN PARSE ERROR OCCURRED!" + Environment.NewLine);
e.Action = ParseErrorAction.AdvanceToNextLine;
}
}
Run Code Online (Sandbox Code Playgroud)
你需要听这个事件:
csvReader.MissingFieldAction = MissingFieldAction.ParseError;
csvReader.DefaultParseErrorAction = ParseErrorAction.RaiseEvent;
csvReader.ParseError += csv_ParseError;
Run Code Online (Sandbox Code Playgroud)
我已经认识到它不能"用作文本文件的引号字符,因为某些字段包含数据RAV4 "Sport" Sport Utility 4D.因此字段本身包含引用字符.相反,你根本不需要一个,因为没有引用任何字段.所以不要在构造函数中提供一个或将其设置为'\0'.然后运行没有问题:
using(var rd = new StreamReader(filePath))
using (var csvReader = new CsvReader(rd, false, '\t', '\0', '\0', '#', ValueTrimmingOptions.All))
{
csvReader.MissingFieldAction = MissingFieldAction.ParseError;
csvReader.DefaultParseErrorAction = ParseErrorAction.RaiseEvent;
csvReader.ParseError += csv_ParseError;
csvReader.SkipEmptyLines = true;
int fieldCount = csvReader.FieldCount;
while (csvReader.ReadNextRecord())
{
var fields = new List<string>();
for (int i = 0; i < fieldCount; i++)
{
fields.Add(csvReader[i]);
}
lines.Add(fields);
}
}
Run Code Online (Sandbox Code Playgroud)