我有一个包含数千行的 1 列数据框,全部基于相同的模式构建,例如:
ids <- c("ETC|HMPI01000001|HMPI01000001.1 TAG: Genus Species, T05X3Ml2_CL10007Cordes1_1","ETC|HMPI31000002|HMPI31000002.1 TAG: Genus Species, T3X3Ml2_CL10157Cordes1_1", "ETC|HMPI01000007|HMPI01000007.1 TAG: Genus Species, T1X3Ml2_CL11231Cordes1_1")
df <- as.data.frame(ids)
Run Code Online (Sandbox Code Playgroud)
> df
ids
1 ETC|HMPI01000001|HMPI01000001.1 TAG: Genus Species, T05X3Ml2_CL10007Cordes1_1
2 ETC|HMPI31000002|HMPI31000002.1 TAG: Genus Species, T3X3Ml2_CL10157Cordes1_1
3 ETC|HMPI01000007|HMPI01000007.1 TAG: Genus Species, T1X3Ml2_CL11231Cordes1_1
Run Code Online (Sandbox Code Playgroud)
我想将这些字符分成两列: var1 和 var2 这样,并保留第二个管道之后和第一个空格之前的文本,以及空格之后第二个 T 中的文本。这些将是所有线路的共同模式。预期结果是:
> df
var1 var2
1 HMPI01000001.1 T05X3Ml2_CL10007Cordes1_1
2 HMPI31000002.1 T3X3Ml2_CL10157Cordes1_1
3 HMPI01000007.1 T1X3Ml2_CL11231Cordes1_1
Run Code Online (Sandbox Code Playgroud)
我尝试了几个受这里、那里或那里启发的正则表达式..但我无法弄清楚。
我目前有这个,但它没有给出预期的结果:
df2 <- df %>% separate(col = "ids", into = …Run Code Online (Sandbox Code Playgroud) 在 R markdown 或 R studio 中,对于这样的行
library('tidyverse')
Run Code Online (Sandbox Code Playgroud)
library颜色为蓝色和tidyverse绿色。当我编织到html时,它们分别显示为深红色和红色。如何编织我的 html 并保持整个文档的原始颜色?在R Markdown Cookbook中,它说我可以使用 aspan tag并设置颜色,但这似乎适用于特定的代码块。我发现这篇文章的背景颜色,而不是文字。或者这个,但又是单个代码块。我相信这是因为颜色在 R 和 HTML 中有不同的名称?<style type="text/css">有没有办法在YAML 标头正下方的部分中指定这一点?我用 R 编写代码,但对 CSS 或 HTML 完全陌生。