正则表达式之间的距离

Nic*_*OEL 9 regex comparison formal-languages

我们可以计算正则表达式之间的距离吗?

这个想法是以两种正则表达式相似的方式进行测量.

Dav*_*rek 5

您可以使用一些指标:

  1. 有效匹配的长度.一些正则表达式具有固定大小,一些是上限,一些是下限.比较它们的长度或可能长度的相似程度.

  2. 匹配的字符.任何正则表达式都有一组匹配可以包含的字符(可能是所有字符).比较包含的字符集.

  3. 使用大型文档,查看每个正则表达式的匹配数量以及相同数量的匹配项.

你在寻找严格的对等吗?


Gum*_*mbo 5

您可以为正则表达式构建确定性有限状态机并比较转换.然后可以使用两个转换的差异来测量这些正则表达式的距离.