小编Car*_*son的帖子

如何使用Python结合正则表达式和字符串/文件操作并存储模式的实例来搜索文本文件中的模式?

所以基本上我正在寻找文本文件中两个尖括号内的4位数代码.我知道我需要打开文本文件然后逐行解析,但我不确定在检查"for line in file"之后构建代码的最佳方法.

我想我可以以某种方式拆分它,剥离它或分区,但我也写了一个我使用编译的正则表达式,所以如果它返回一个匹配对象,我不认为我可以使用那些基于字符串的操作.另外我不确定我的正则表达式是否足够贪婪......

我想将所有找到的匹配的实例存储为元组或列表中的字符串.

这是我的正则表达式:

regex = re.compile("(<(\d{4,5})>)?")
Run Code Online (Sandbox Code Playgroud)

考虑到目前为止相当基本的代码,我认为我不需要包含所有代码.

python regex file-io text-mining string-parsing

41
推荐指数
2
解决办法
13万
查看次数

标签 统计

file-io ×1

python ×1

regex ×1

string-parsing ×1

text-mining ×1