小编swe*_*ity的帖子

R 中 stri_detect_regex 错误

我收到此错误

stri_detect_regex(string, pattern, opts_regex = opts(pattern)) 中的错误:正则表达式模式中的括号嵌套不正确。(U_REGEX_MISMATCHED_PAREN)

当我运行代码时

  # find occurrences of initial dataframe
  named_RN$search <- map_int(named_RN$V1, function(x){sum(str_detect(final_RN$named_RN, pattern = x))})
Run Code Online (Sandbox Code Playgroud)

其中named_RN$V1看起来像

aldosterone
renin
potassium
calcitrol
Run Code Online (Sandbox Code Playgroud)

看起来final_RN$named_RN

aldosterone, creatinine 
human, warfarin
aspirin, renin, calcitrol
magnesium, calcitrol
Run Code Online (Sandbox Code Playgroud)

我的代码旨在创建一个新变量,其中named_RN显示每个短语的原始计数,因此named_RN看起来像

V1              search
aldosterone     1
renin           0
potassium       0
calcitrol       2
Run Code Online (Sandbox Code Playgroud)

请指教。谢谢。

regex error-handling text r dataframe

5
推荐指数
1
解决办法
1万
查看次数

在 R 中将字符 (0) 保留为空字符串的同时取消列出列

我对 R 比较陌生。我有一个数据框,其中有一列存储为列表。我的列包含c("Benzo", "Ferri")character(0)是否为空。如何将它们更改为简单Benzo, Ferri的字符(0)的空字符串?

我不能,例如df$general_RN <- unlist(df$general_RN)因为Error in $<-.data.frame(*tmp*, general_RN, value = c("Drug Combinations", : replacement has 1992 rows, data has 10479

我假设所有的character(0)都已删除,但我需要将它们保留为NAs。

这是该列的外观

general_RN
c("Chlorambucil", "Vincristine", "Cyclophosphamide")
Pentazocine
character(0)
character(0)
c("Ampicillin", "Trimethoprim")
character(0)
Run Code Online (Sandbox Code Playgroud)

我羞愧地在这个问题上花了一个小时。

谢谢你的建议。

text r list character na

4
推荐指数
1
解决办法
2259
查看次数

R中将一个变量拆分为多个变量

我对 R 比较陌生。我的问题并不完全像标题那么简单。这是一个示例df

id    amenities
1     wireless internet, air conditioning, pool, kitchen
2     pool, kitchen, washer, dryer
3     wireless internet, kitchen, dryer
4     
5     wireless internet
Run Code Online (Sandbox Code Playgroud)

这就是我想要df的样子:

id    wireless internet   air conditioning   pool   kitchen   washer   dryer
1     1                   1                  1      1         0        0
2     0                   0                  1      1         1        1
3     1                   0                  0      1         0        1
4     0                   0                  0      0         0        0
5     1                   0                  0      0         0        0
Run Code Online (Sandbox Code Playgroud)

重现数据的示例代码

df <- data.frame(id = …
Run Code Online (Sandbox Code Playgroud)

string variables split r dataframe

3
推荐指数
1
解决办法
7732
查看次数

is.atomic()vs is.vector()

我不明白之间的差别is.atomic()is.vector().根据我的理解,is.vector()返回TRUE同类1D数据结构.我相信逻辑,双精度,整数,字符,复合体和原始数据的is.atomic()回报TRUE......但是,不会is.vector()这样吗?所以我想也许差异在于它的尺寸,但在双打的数据框中is.atomic()返回FALSE,这让我更加困惑啊......

另外,原子矢量和法向量之间有什么区别?

谢谢你的澄清!

r vector atomic typeof data-structures

2
推荐指数
1
解决办法
2541
查看次数

折叠唯一的行但保留R中的变量

我对R比较陌生,不知道如何用短语来表达我的问题.基本上,我有一个test看起来像这样的数据框:

PMID     PL           subject
1        Canada       neurology
2        USA          cancer
5        Canada       dermatology
2        USA          respiratory
4        Japan        neurology
2        USA          cancer
5        Canada       cardiovascular
Run Code Online (Sandbox Code Playgroud)

我要转换成

PMID      PL        subject
1         Canada    neurology
2         USA       cancer, respiratory
5         Canada    dermatology, cardiovascular
4         Japan     neurology
Run Code Online (Sandbox Code Playgroud)

实质上,每个PMID可以与多个主题相关联,因此我希望保留该信息.我只想要唯一的PMID行.我也想删除重复次数(例如,有3行"2"但其中2行是"癌症".另外,我还有其他变量,每个PMID对于其他每个都有相同的值变量(主题除外).

请指教.

谢谢!

variables r unique collapse dataframe

1
推荐指数
1
解决办法
85
查看次数