我收到此错误
stri_detect_regex(string, pattern, opts_regex = opts(pattern)) 中的错误:正则表达式模式中的括号嵌套不正确。(U_REGEX_MISMATCHED_PAREN)
当我运行代码时
# find occurrences of initial dataframe
named_RN$search <- map_int(named_RN$V1, function(x){sum(str_detect(final_RN$named_RN, pattern = x))})
Run Code Online (Sandbox Code Playgroud)
其中named_RN$V1看起来像
aldosterone
renin
potassium
calcitrol
Run Code Online (Sandbox Code Playgroud)
看起来final_RN$named_RN像
aldosterone, creatinine
human, warfarin
aspirin, renin, calcitrol
magnesium, calcitrol
Run Code Online (Sandbox Code Playgroud)
我的代码旨在创建一个新变量,其中named_RN显示每个短语的原始计数,因此named_RN看起来像
V1 search
aldosterone 1
renin 0
potassium 0
calcitrol 2
Run Code Online (Sandbox Code Playgroud)
请指教。谢谢。
我对 R 比较陌生。我有一个数据框,其中有一列存储为列表。我的列包含c("Benzo", "Ferri")或character(0)是否为空。如何将它们更改为简单Benzo, Ferri的字符(0)的空字符串?
我不能,例如df$general_RN <- unlist(df$general_RN)因为Error in $<-.data.frame(*tmp*, general_RN, value = c("Drug Combinations", : replacement has 1992 rows, data has 10479
我假设所有的character(0)都已删除,但我需要将它们保留为NAs。
这是该列的外观
general_RN
c("Chlorambucil", "Vincristine", "Cyclophosphamide")
Pentazocine
character(0)
character(0)
c("Ampicillin", "Trimethoprim")
character(0)
Run Code Online (Sandbox Code Playgroud)
我羞愧地在这个问题上花了一个小时。
谢谢你的建议。
我对 R 比较陌生。我的问题并不完全像标题那么简单。这是一个示例df:
id amenities
1 wireless internet, air conditioning, pool, kitchen
2 pool, kitchen, washer, dryer
3 wireless internet, kitchen, dryer
4
5 wireless internet
Run Code Online (Sandbox Code Playgroud)
这就是我想要df的样子:
id wireless internet air conditioning pool kitchen washer dryer
1 1 1 1 1 0 0
2 0 0 1 1 1 1
3 1 0 0 1 0 1
4 0 0 0 0 0 0
5 1 0 0 0 0 0
Run Code Online (Sandbox Code Playgroud)
重现数据的示例代码
df <- data.frame(id = …Run Code Online (Sandbox Code Playgroud) 我不明白之间的差别is.atomic()和is.vector().根据我的理解,is.vector()返回TRUE同类1D数据结构.我相信逻辑,双精度,整数,字符,复合体和原始数据的is.atomic()回报TRUE......但是,不会is.vector()这样吗?所以我想也许差异在于它的尺寸,但在双打的数据框中is.atomic()返回FALSE,这让我更加困惑啊......
另外,原子矢量和法向量之间有什么区别?
谢谢你的澄清!
我对R比较陌生,不知道如何用短语来表达我的问题.基本上,我有一个test看起来像这样的数据框:
PMID PL subject
1 Canada neurology
2 USA cancer
5 Canada dermatology
2 USA respiratory
4 Japan neurology
2 USA cancer
5 Canada cardiovascular
Run Code Online (Sandbox Code Playgroud)
我要转换成
PMID PL subject
1 Canada neurology
2 USA cancer, respiratory
5 Canada dermatology, cardiovascular
4 Japan neurology
Run Code Online (Sandbox Code Playgroud)
实质上,每个PMID可以与多个主题相关联,因此我希望保留该信息.我只想要唯一的PMID行.我也想删除重复次数(例如,有3行"2"但其中2行是"癌症".另外,我还有其他变量,每个PMID对于其他每个都有相同的值变量(主题除外).
请指教.
谢谢!