csv解析器读取标头

Avi*_*ash 11 java csv parsing

我正在研究一个csv解析器,我想分别读取头文件和其余的csv文件.这是我读取csv的代码.

当前代码读取csv文件中的所有内容,但我需要单独读取标头.请帮我解决这个问题.

public class csv {

private void csvRead(File file)
{
    try
    {
    BufferedReader br = new BufferedReader( new FileReader(file));
    String strLine = "";
    StringTokenizer st = null;
    File cfile=new File("csv.txt");
    BufferedWriter writer = new BufferedWriter(new FileWriter(cfile));
    int tokenNumber = 0;

    while( (strLine = br.readLine()) != null)
    {
            st = new StringTokenizer(strLine, ",");
            while(st.hasMoreTokens())
            {

                    tokenNumber++;
                    writer.write(tokenNumber+"  "+ st.nextToken());
                    writer.newLine();
            }


            tokenNumber = 0;
            writer.flush();
    }
}

    catch(Exception e)
    {
        e.getMessage();
    }
}
Run Code Online (Sandbox Code Playgroud)

Raj*_* Gr 7

我们在CSVFormat中提供了withHeader()方法.如果使用此选项,则可以使用标题读取文件.

CSVFormat format = CSVFormat.newFormat(',').withHeader();
Map<String, Integer> headerMap = dataCSVParser.getHeaderMap(); 
Run Code Online (Sandbox Code Playgroud)

会给你所有标题.

public class CSVFileReaderEx {
    public static void main(String[] args){
        readFile();
    }

    public static void readFile(){
         List<Map<String, String>> csvInputList = new CopyOnWriteArrayList<>();
         List<Map<String, Integer>> headerList = new CopyOnWriteArrayList<>();

         String fileName = "C:/test.csv";
         CSVFormat format = CSVFormat.newFormat(',').withHeader();

          try (BufferedReader inputReader = new BufferedReader(new FileReader(new File(fileName)));
                  CSVParser dataCSVParser = new CSVParser(inputReader, format); ) {

             List<CSVRecord> csvRecords = dataCSVParser.getRecords();

             Map<String, Integer> headerMap = dataCSVParser.getHeaderMap();
              headerList.add(headerMap);
              headerList.forEach(System.out::println);

             for(CSVRecord record : csvRecords){
                 Map<String, String> inputMap = new LinkedHashMap<>();

                 for(Map.Entry<String, Integer> header : headerMap.entrySet()){
                     inputMap.put(header.getKey(), record.get(header.getValue()));
                 }

                 if (!inputMap.isEmpty()) {
                     csvInputList.add(inputMap);
                } 
             }

             csvInputList.forEach(System.out::println);

          } catch (Exception e) {
             System.out.println(e);
          }
    }
}
Run Code Online (Sandbox Code Playgroud)


Fra*_*eth 6

请考虑使用Commons CSV.此库是根据RFC 4180 - 逗号分隔值(CSV)文件的通用格式和MIME类型编写的.什么是兼容读取这样的行:

"aa,a","b""bb","ccc"
Run Code Online (Sandbox Code Playgroud)

而且使用非常简单,只有3个类,并且根据文档提供了一些小样本:

解析具有选项卡作为分隔符的csv-string,'"作为可选值封装器,以及以'#'开头的注释:

 CSVFormat format = new CSVFormat('\t', '"', '#');
 Reader in = new StringReader("a\tb\nc\td");
 String[][] records = new CSVParser(in, format).getRecords();
Run Code Online (Sandbox Code Playgroud)

此外,您还可以将此解析器作为常量使用:

  • DEFAULT - RFC 4180定义的标准逗号分隔格式.
  • EXCEL - Excel文件格式(使用逗号作为值分隔符).
  • MYSQL - SELECT INTO OUTFILE和LOAD DATA INFILE操作使用的默认MySQL格式.TDF - 制表分隔格式.


dav*_*rld 3

您考虑过OpenCSV吗?

上一个问题在这里...

Java 的 CSV API

看起来你可以很容易地拆分标题......

String fileName = "data.csv";
CSVReader reader = new CSVReader(new FileReader(fileName ));


// if the first line is the header
String[] header = reader.readNext();

// iterate over reader.readNext until it returns null
String[] line = reader.readNext();
Run Code Online (Sandbox Code Playgroud)