我认为我想做的是一项相当普遍的任务,但我在网上找不到任何参考.我有带标点符号的文字,我想要一个单词列表.
"Hey, you - what are you doing here!?"
Run Code Online (Sandbox Code Playgroud)
应该
['hey', 'you', 'what', 'are', 'you', 'doing', 'here']
Run Code Online (Sandbox Code Playgroud)
但是Python str.split()只能使用一个参数,所以在用空格分割之后,我所有的单词都带有标点符号.有任何想法吗?
我想从字符串中过滤掉特殊字符,但我也想保留其中的一些字符(例如,我想保留撇号、&、-、%)
这段代码将保留撇号,但如何添加我想保留的其他符号?
msg = 'Hi! I'm Mike, I like M&M. How are you?'
pattern = re.compile("[^\w']")
pattern.sub ('', msg)
>>Output Desired: "Hi I'm Mike I like M&M How are you"
Run Code Online (Sandbox Code Playgroud)