e-s*_*tis 8 python regex data-generation
鉴于正则表达式,我想生成随机数据x次数来测试某些东西.
例如
>>> print generate_date('\d{2,3}')
13
>>> print generate_date('\d{2,3}')
422
Run Code Online (Sandbox Code Playgroud)
当然,目标是做一些比电话号码和电子邮件地址更复杂的事情.
这样的事情存在吗?如果是的话,Python是否存在?如果没有,我可以使用任何线索/理论来做到这一点?
Pyparsing包括这个正则表达式逆变器,它返回所有排列的发生器,用于简单的正则表达式.以下是该模块的一些测试用例:
[A-C]{2}\d{2}
@|TH[12]
@(@|TH[12])?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9]))?
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9])|OH(1[0-9]?|2[0-9]?|30?|[4-9]))?
(([ECMP]|HA|AK)[SD]|HS)T
[A-CV]{2}
A[cglmrstu]|B[aehikr]?|C[adeflmorsu]?|D[bsy]|E[rsu]|F[emr]?|G[ade]|H[efgos]?|I[nr]?|Kr?|L[airu]|M[dgnot]|N[abdeiop]?|Os?|P[abdmortu]?|R[abefghnu]|S[bcegimnr]?|T[abcehilm]|Uu[bhopqst]|U|V|W|Xe|Yb?|Z[nr]
(a|b)|(x|y)
Run Code Online (Sandbox Code Playgroud)
编辑:
要进行随机选择,请创建一个列表(一次!),然后random.choice
在每次需要与正则表达式匹配的随机字符串时调用列表,如下所示(未经测试):
class RandomString(object):
def __init__(self, regex):
self.possible_strings = list(invRegex.invert(regex))
def random_string(self):
return random.choice(self.possible_strings)
Run Code Online (Sandbox Code Playgroud)