小编iCy*_*iCy的帖子

Python字符串模式识别/压缩

我可以做基本的正则表达式,但这有点不同,即我不知道模式是什么.

例如,我有一个类似字符串的列表:

lst = ['asometxt0moretxt', 'bsometxt1moretxt', 'aasometxt10moretxt', 'zzsometxt999moretxt']
Run Code Online (Sandbox Code Playgroud)

在这种情况下,常见模式是两段常见文本:'sometxt'并且'moretxt',由长度可变的其他内容开始和分隔.

公共字符串和变量字符串当然可以在任何顺序和任何数量的场合发生.

将字符串列表压缩/压缩为公共部分和个别变体的好方法是什么?

示例输出可能是:

c = ['sometxt', 'moretxt']

v = [('a','0'), ('b','1'), ('aa','10'), ('zz','999')]
Run Code Online (Sandbox Code Playgroud)

python compression string pattern-recognition

7
推荐指数
2
解决办法
5246
查看次数

标签 统计

compression ×1

pattern-recognition ×1

python ×1

string ×1