所以我有一个街道地址的数据集,它们的格式非常不同.例如:
d <- c("street1234", "Street 423", "Long Street 12-14", "Road 18A", "Road 12 - 15", "Road 1/2")
Run Code Online (Sandbox Code Playgroud)
从这里我想创建两列.1. X:街道地址和2. Y:数字+随后的所有内容.像这样:
X Y
Street 1234
Street 423
Long Street 12-14
Road 18A
Road 12 - 15
Road 1/2
Run Code Online (Sandbox Code Playgroud)
到目前为止,我已尝试过strsplit,并在此处遵循了一些类似的问题,例如:strsplit(d, split = "(?<=[a-zA-Z])(?=[0-9])", perl = T)).我似乎无法找到正确的正则表达式.
任何帮助都非常感谢.先感谢您!