查找csv文件中的列数

Question

查找csv文件中的列数

我的程序需要读取可能有1,2或3列的csv文件,并且需要相应地修改其行为.在迭代器运行之前,是否有一种简单的方法可以检查列数而不"消耗"一行？以下代码是我可以管理的最优雅的代码,但我更愿意在for循环开始之前运行检查:

import csv
f = 'testfile.csv'
d = '\t'

reader = csv.reader(f,delimiter=d)
for row in reader:
    if reader.line_num == 1: fields = len(row)
    if len(row) != fields:
        raise CSVError("Number of fields should be %s: %s" % (fields,str(row)))
    if fields == 1:
        pass
    elif fields == 2:
        pass
    elif fields == 3:
        pass
    else:
        raise CSVError("Too many columns in input file.")

Run Code Online (Sandbox Code Playgroud)

编辑:我应该包含有关我的数据的更多信息.如果只有一个字段,则必须包含科学记数法的名称.如果有两个字段,则第一个字段必须包含名称,第二个字段必须包含链接代码.如果有三个字段,则附加字段包含一个标志,该标志指定名称当前是否有效.因此,如果任何行包含1,2或3列,则所有行必须具有相同的列.

Answer 1

Joh*_*ooy 24

你可以使用itertools.tee

itertools.tee(iterable [,n = 2])
从单个iterable返回n个独立迭代器.

例如.

reader1, reader2 = itertools.tee(csv.reader(f, delimiter=d))
columns = len(next(reader1))
del reader1
for row in reader2:
    ...

Run Code Online (Sandbox Code Playgroud)

请注意,删除reader1完成时的引用非常重要- 否则tee必须将所有行存储在内存中以防next(reader1)再次调用

Answer 2

mgi*_*son 12

这似乎也有效:

import csv

datafilename = 'testfile.csv'
d = '\t'
f=open(datafilename,'r')

reader=csv.reader(f,delimiter=d)
ncol=len(next(reader)) # Read first line and count columns
f.seek(0)              # go back to beginning of file
for row in reader:
    pass  #dostuff

Run Code Online (Sandbox Code Playgroud)

Answer 3

Ash*_*aee 5

我建议像这样的简单方法：

with open('./testfile.csv', 'r') as csv:
     first_line = csv.readline()
     your_data = csv.readlines()

ncol = first_line.count(',') + 1

Run Code Online (Sandbox Code Playgroud)

归档时间：	13 年，6 月前
查看次数：	47367 次
最近记录：	6 年，6 月前