相关疑难解决方法(0)

如何拆分多个连接的单词?

我有一个1000个左右的数组,下面是一些例子:

wickedweather
liquidweather
driveourtrucks
gocompact
slimprojector
Run Code Online (Sandbox Code Playgroud)

我希望能够将这些分成各自的词,如:

wicked weather
liquid weather
drive our trucks
go compact
slim projector
Run Code Online (Sandbox Code Playgroud)

我希望有一个正则表达式,我可以做到这一点.但是,既然没有边界可以停下来,也没有任何我可以关键的大写,我想,有些类型的字典引用可能是必要的吗?

我想它可以手工完成,但为什么 - 什么时候可以用代码完成!=)但这让我很难过.有任何想法吗?

string nlp

46
推荐指数
4
解决办法
2万
查看次数

如何有效地从连续字符串中提取文字单词?

可能重复:
如何将没有空格的文本拆分成单词列表?

人们的评论中有大量的文本信息,这些信息是从html中解析出来的,但它们中没有分隔字符.例如:thumbgreenappleactiveassignmentweeklymetaphor.显然,字符串中有"拇指","绿色","苹果"等.我还有一个大词典来查询这个词是否合理.那么,提取这些单词的最快方法是什么?

python algorithm text-extraction extract

2
推荐指数
1
解决办法
1352
查看次数

标签 统计

algorithm ×1

extract ×1

nlp ×1

python ×1

string ×1

text-extraction ×1