用于保存解析的 CSV 文件内容的数据结构

Question

用于保存解析的 CSV 文件内容的数据结构

我试图找出用 Java 解析 csv 文件的最佳方法是什么。现在每行将有 X 数量的信息。例如，第一行最多可以有 5 个字符串单词（用逗号分隔它们），而接下来的几行可能有 3 或 6 个或其他。

我的问题不是从文件中读取字符串。只是要明确一点。我的问题是哪种数据结构最适合保存每一行以及该行中的每个单词？

起初我考虑使用二维数组，但问题是数组大小必须是静态的（第二个索引大小将保存每行中有多少个单词，每行可能不同）。

这是 CSV 文件的前几行：

0,MONEY
1,SELLING
2,DESIGNING
3,MAKING
DIRECTOR,3DENT95VGY,EBAD,SAGHAR,MALE,05/31/2011,null,0,10000,07/24/2011
3KEET95TGY,05/31/2011,04/17/2012,120050
3LERT9RVGY,04/17/2012,03/05/2013,132500
3MEFT95VGY,03/05/2013,null,145205
DIRECTOR,XKQ84P6CDW,AGHA,ZAIN,FEMALE,06/06/2011,null,1,1000,01/25/2012
XK4P6CDW,06/06/2011,09/28/2012,105000
XKQ8P6CW,09/28/2012,null,130900
DIRECTOR,YGUSBQK377,AYOUB,GRAMPS,FEMALE,10/02/2001,12/17/2007,2,12000,01/15/2002

Run Code Online (Sandbox Code Playgroud)

Answer 1

Cht*_*ect 4

你可以使用一个Map<Integer, List<String>>. 键是 csv 文件中的行号，列表是每行中的单词。

附加一点：您可能最终会List#get(int)经常使用方法。如果是这种情况，请勿使用链表。这是因为get(int)链表的复杂度是 O(n)。我认为这ArrayList是你最好的选择。

编辑（基于 AlexWien 的观察）：

在这种特殊情况下，由于键是行号，因此产生一组连续的整数，因此更好的数据结构可能是ArrayList<ArrayList<String>>. 这将导致更快的密钥检索。

归档时间：	11 年，10 月前
查看次数：	5774 次
最近记录：	11 年，5 月前