计算以逗号分隔的字符串中的元素数

FaC*_*fee 7 python text comma text-mining

我正在处理文本字符串,如下所示: LN1 2DW, DN21 5BJ, DN21 5BL, ...

在Python中,我如何计算逗号之间的元素数量?每个元素可以由6个,7个或8个字符组成,在我的示例中,显示了3个元素.分隔符始终是逗号.

我从未做过任何与文本挖掘有关的事情,所以这对我来说是一个开始.

Psi*_*dom 19

你可以计算逗号的数量:

text.count(",") + 1
# 3
Run Code Online (Sandbox Code Playgroud)

  • @BramVanroy 使用“ipython”及其内置的“%timeit”进行了真正的快速测试。结果: `text.count(',')+1`:每个循环 665 ns ± 3.06 ns `len(text.split(','))`:每个循环 3.59 µs ± 19.3 ns 测试数据为 91 个列表元素。 (3认同)

Wil*_*sem 9

如果逗号(,)是分隔符,则只需str.split对字符串使用,然后len(..)对结果使用:

text = 'LN1 2DW, DN21 5BJ, DN21 5B'
number = len(text.split(','))
Run Code Online (Sandbox Code Playgroud)

您还可以重用元素列表.例如:

text = 'LN1 2DW, DN21 5BJ, DN21 5B'
tags = text.split(',')
number = len(tags)
#do something with the `tags`
Run Code Online (Sandbox Code Playgroud)

  • Text.count(',')+1 (2认同)
  • 这项工作确实更有效,但下一步可能是迭代元素. (2认同)