相关疑难解决方法(0)

将字符串拆分为具有多个单词边界分隔符的单词

我认为我想做的是一项相当普遍的任务,但我在网上找不到任何参考.我有带标点符号的文字,我想要一个单词列表.

"Hey, you - what are you doing here!?"
Run Code Online (Sandbox Code Playgroud)

应该

['hey', 'you', 'what', 'are', 'you', 'doing', 'here']
Run Code Online (Sandbox Code Playgroud)

但是Python str.split()只能使用一个参数,所以在用空格分割之后,我所有的单词都带有标点符号.有任何想法吗?

python string split

631
推荐指数
12
解决办法
63万
查看次数

基于正则表达式拆分字符串

我以表格形式输出命令.我正在从结果文件中解析此输出并将其存储在字符串中.一行中的每个元素由一个或多个空格字符分隔,因此我使用正则表达式匹配1个或多个空格并将其拆分.但是,在每个元素之间插入一个空格:

>>> str1="a    b     c      d" # spaces are irregular
>>> str1
'a    b     c      d'
>>> str2=re.split("( )+", str1)
>>> str2
['a', ' ', 'b', ' ', 'c', ' ', 'd'] # 1 space element between!!!
Run Code Online (Sandbox Code Playgroud)

有一个更好的方法吗?

将每个拆分str2附加到列表后.

python regex

125
推荐指数
3
解决办法
19万
查看次数

标签 统计

python ×2

regex ×1

split ×1

string ×1