用Java编写文件解析器的技巧?

def*_*alt 6 java parsing

编辑:我主要解析"逗号分隔的值",模糊带来了这个词我的注意.

解释CSV块是这里的主要问题.

我知道如何将文件读成类似于String[]某些基本功能的东西String,但我不认为使用类似的方法contains()并按字符分析所有内容都可行.

我有什么方法可以更聪明地做到这一点?

一行示例:

-barfoob: boobs, foob, "foo bar"

Mic*_*rdt 7

每个人都假设你在谈论XML是有原因的:面对XML解析器的成熟和易用性,发明一种专有的基于文本的文件格式需要非常强有力的理由.

而你的问题表明你对解析器的了解很少(否则你会编写一个ANTLRJavaCC语法而不是问这个问题) - 这是另一个反对滚动你自己的强有力的论据,除了作为一种学习经验.


bgu*_*uiz 6

由于输入" 与HTML格式相似 ",因此您的数据很可能使用树状结构进行最佳表示,而且很可能是XML或类似于XML.

如果是这种情况,我建议解析文件的最聪明方法是使用XML解析器.

以下是您可能会发现有用的一些资源:

HTH


def*_*alt 2

以及通过维基百科挖掘相关文章可能就足够了。