4 c++ csv algorithm parsing
我编写了一个简单的CSV文件解析器。但是在查看CSV格式的Wiki页面后,我注意到基本格式有一些“扩展”。通过双引号专门嵌入逗号。我设法解析了这些,但是还有第二个问题:嵌入式双引号。
例:
12345,“ ABC,”“ IJK”“ XYZ”-> [1234]和[ABC,“ IJK” XYZ]
我似乎找不到正确的方法来区分封闭的双引号和无双引号。所以我的问题是解析CVS格式(例如上述格式)的正确方法/算法是什么?
Sin*_*ion 5
我通常认为的方式基本上是将带引号的值视为单个,不带引号的值或双引号的值的序列,这些值形成用引号连接的值。那是,
本质上,分割带引号的字符串的每个双引号段,然后将它们与引号一起分类。因此:"ABC, ""IJK"" XYZ"变ABC, ,IJK, XYZ,这反过来又成为ABC, "IJK" XYZ
"ABC, ""IJK"" XYZ"
ABC,
IJK
XYZ
ABC, "IJK" XYZ
归档时间:
14 年,10 月 前
查看次数:
4051 次
最近记录: