Python解析CSV忽略带双引号的逗号

Abh*_*ath 23 python csv python-2.7

我有一个CSV文件,其中包含以下行:

"AAA", "BBB", "Test, Test", "CCC"
"111", "222, 333", "XXX", "YYY, ZZZ" 
Run Code Online (Sandbox Code Playgroud)

等等 ...

我不想用双引号解析逗号.即.我的预期结果应该是

AAA
BBB
Test, Test
CCC
Run Code Online (Sandbox Code Playgroud)

我的代码:

import csv
with open('values.csv', 'rb') as f:
    reader = csv.reader(f)
    for row in reader:
        print row
Run Code Online (Sandbox Code Playgroud)

我尝试在python下使用csv包但没有运气.解析会爆炸所有逗号.

如果我遗失了什么,请告诉我

Mic*_*ael 43

这应该做:

lines = '''"AAA", "BBB", "Test, Test", "CCC"
           "111", "222, 333", "XXX", "YYY, ZZZ"'''.splitlines()
for l in  csv.reader(lines, quotechar='"', delimiter=',',
                     quoting=csv.QUOTE_ALL, skipinitialspace=True):
    print l
>>> ['AAA', 'BBB', 'Test, Test', 'CCC']
>>> ['111', '222, 333', 'XXX', 'YYY, ZZZ']
Run Code Online (Sandbox Code Playgroud)

  • 此外,如果您的 CSV 中有这样的值 _"Test,\"Test\""_,您可能还需要添加 _escapechar='\\'_ 我只是需要它!:) (4认同)

Mar*_*ers 12

输入中的引号字符前面有空格.设置skipinitialspaceTrue跳过分隔符后面的任何空格:

何时True,忽略分隔符后面的空格.默认是False.

>>> import csv
>>> lines = '''\
... "AAA", "BBB", "Test, Test", "CCC"
... "111", "222, 333", "XXX", "YYY, ZZZ" 
... '''
>>> reader = csv.reader(lines.splitlines())
>>> next(reader)
['AAA', ' "BBB"', ' "Test', ' Test"', ' "CCC"']
>>> reader = csv.reader(lines.splitlines(), skipinitialspace=True)
>>> next(reader)
['AAA', 'BBB', 'Test, Test', 'CCC']
Run Code Online (Sandbox Code Playgroud)

  • 我不确定除了文档之外我还能告诉你什么。逗号后面有空格,这些空格被视为列值的一部分,除非您将 `skipinitialspace` 选项设置为 true。并且值周围的引号不能有引号之外的字符(或者它们不会在值周围;当逗号后面的空格被视为值的一部分时,引用也是值的一部分。通过跳过space 引号是值的最外层部分,因此可以正确处理。 (2认同)