相关疑难解决方法(0)

将字符串拆分为具有多个单词边界分隔符的单词

我认为我想做的是一项相当普遍的任务,但我在网上找不到任何参考.我有带标点符号的文字,我想要一个单词列表.

"Hey, you - what are you doing here!?"
Run Code Online (Sandbox Code Playgroud)

应该

['hey', 'you', 'what', 'are', 'you', 'doing', 'here']
Run Code Online (Sandbox Code Playgroud)

但是Python str.split()只能使用一个参数,所以在用空格分割之后,我所有的单词都带有标点符号.有任何想法吗?

python string split

631
推荐指数
12
解决办法
63万
查看次数

读取文本文件并将其拆分为python中的单个单词

所以我有这个文本文件由数字和单词组成,例如像这样 - 09807754 18 n 03 aristocrat 0 blue_blood 0 patrician我想拆分它,以便每个单词或数字都会作为一个新行出现.

一个空白分隔符是理想的,因为我希望带有破折号的单词保持连接.

这是我到目前为止:

f = open('words.txt', 'r')
for word in f:
    print(word)
Run Code Online (Sandbox Code Playgroud)

我不确定如何离开这里,我希望这是输出:

09807754
18
n
3
aristocrat
...
Run Code Online (Sandbox Code Playgroud)

python string split

47
推荐指数
4
解决办法
24万
查看次数

用于查找字符串中所有单词的Python正则表达式

你好,我是新的正则表达式,我开始使用python.我坚持从英语句子中提取所有单词.到目前为止,我有:

import re

shop="hello seattle what have you got"
regex = r'(\w*) '
list1=re.findall(regex,shop)
print list1
Run Code Online (Sandbox Code Playgroud)

这给出了输出:

['你好','西雅图','什么','有','你']

如果我替换正则表达式

regex = r'(\w*)\W*'
Run Code Online (Sandbox Code Playgroud)

然后输出:

['你好','西雅图','什么','有','你','有','']

而我想要这个输出

['你好','西雅图','什么','有','你','有']

请指出我哪里出错了.

python regex words sentence

7
推荐指数
1
解决办法
2万
查看次数

标签 统计

python ×3

split ×2

string ×2

regex ×1

sentence ×1

words ×1