小编Die*_*los的帖子

我在 R 中的字符列上应用了 NA 的separate() 函数

我正在尝试拆分格式非常不同的列。例如:

pharma <- c("DOXORUBICINA CLORH. FAM 50MG POL O LIOF",
                   "DROSPIRENONA/ETINILESTR. 3/0,02MG CM REC",
                   "DROSPIRENONA/ETINILESTR. 3/0,03MG CM REC",
                   "ETRAVIRINA 100 MG CM",
                   "AGALSIDASA ALFA 1MG/ML X 3,5 ML FAM")
Run Code Online (Sandbox Code Playgroud)

我正在使用separate()在两个不同的列中进行拆分(我需要将产品名称(即 DOXORUBICINA CLORH. FAM)和详细信息(50MG POL O LIOF)分开)。代码是:

separate(data.frame(A = pharma), col = "A" , into = c("x","y"),sep = "(?<=[a-zA-Z])\\s*(?=[0-9])")
Run Code Online (Sandbox Code Playgroud)

但我有来自 R 的下一个:

                                         x               y
1                  DOXORUBICINA CLORH. FAM 50MG POL O LIOF
2 DROSPIRENONA/ETINILESTR. 3/0,02MG CM REC            <NA>
3 DROSPIRENONA/ETINILESTR. 3/0,03MG CM REC            <NA>
4                               ETRAVIRINA       100 MG CM …
Run Code Online (Sandbox Code Playgroud)

regex r strsplit

2
推荐指数
1
解决办法
57
查看次数

标签 统计

r ×1

regex ×1

strsplit ×1