我想将鼠标悬停在单词上时显示 R markdown 文件中单词的定义。
对于链接,可以这样做:[I'm an inline-style link with title](https://www.google.com "Google's Homepage")将鼠标悬停在I'm an inline-style link with title文本上时Google's Homepage会弹出。但是,我想对一个单词执行相同的操作,并在没有链接的框中给出该单词的定义。
就像是:[word]("Definition of word that pops up in a box upon hovering")。这可能吗?
我正在使用R.
set.seed(1)
Data <- data.frame(id = seq(1, 10),
Diag1 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag2 = sample(c("D123", "E123", "F123"), 10, replace = TRUE),
Diag3 = sample(c("G123", "H123", "I123"), 10, replace = TRUE),
Diag4 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag5 = sample(c("J123", "K123", "L123"), 10, replace = TRUE),
Diag6 = sample(c("M123", "N123", "O123"), 10, replace = TRUE),
Diag7 = sample(c("P123", "Q123", "R123"), 10, replace = TRUE))
Data
Run Code Online (Sandbox Code Playgroud)
我有这样的数据框架.实际上它有34个变量和1.5 Mio观测值.它是一个包含患者数据的数据框.(ID和诊断(ICD10)A123和B123代表某些诊断.我想提取所有患有这些诊断的患者.实际上我正在寻找不同ICD10诊断的100个内的6个诊断.我寻找的每个诊断都可以是出现在任何列中,但它们是相互排斥的.最后,我将有一个大约4000个观测值的数据帧,而不是1.5兆欧.
我的目标是获得一个数据框,我只保留包含A123或B123的行.A123和B123不能在同一行.但它们可以出现在每一栏中.
当我这样做时,我设法为一个变量执行此操作:
DataA123 <- Data[Data$Diag1 == …Run Code Online (Sandbox Code Playgroud) 我想要向量 x 中元素的索引
x <- c("apple", "banana", "peach", "cherry")
Run Code Online (Sandbox Code Playgroud)
有了基础 R 我会这样做
which(x == "peach")
Run Code Online (Sandbox Code Playgroud)
但由于我的 x 位于管道的末端,我想以 magrittr 的方式获取索引。
x %>% getIndex("peach")
Run Code Online (Sandbox Code Playgroud)
我想要的输出是3。
我有一个数据框,诊断为变量,患者作为观察.这是32个变量和5000个观测值.
请看这个例子.
我的目标是计算和总结数据框中的所有诊断
set.seed(1)
Data <- data.frame(id = seq(1, 10),
Diag1 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag2 = sample(c("D123", "E123", "F123"), 10, replace = TRUE),
Diag3 = sample(c("G123", "H123", "I123"), 10, replace = TRUE),
Diag4 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag5 = sample(c("J123", "K123", "L123"), 10, replace = TRUE),
Diag6 = sample(c("M123", "N123", "O123"), 10, replace = TRUE),
Diag7 = sample(c("P123", "Q123", "R123"), 10, replace = TRUE))
Data
class(Data)
mode(Data)
Run Code Online (Sandbox Code Playgroud)
我知道如何使用plyr包对一列进行此操作
NoDiag1 <- count(Data, …Run Code Online (Sandbox Code Playgroud) 假设我使用mtcars数据集.我想根据重量(wt)设置点的大小.如果我这样做,如下所示,R/ggplot2将给我一个4类(2,3,4,5)的图例.
library(ggplot2)
mtc <- mtcars
p1 <- ggplot(mtc, aes(x = hp, y = mpg))
p1 <- p1 + geom_point(aes(size = wt))
print(p1)
Run Code Online (Sandbox Code Playgroud)
如何更改图例的比例/名称/类别.如果"类别"是因素,我找到了有关如何执行此操作的信息,但我不知道如何使用数值来执行此操作.我需要保持数字,否则它不再适用于点的大小.
我的真实数据集有大约100个wt值(从1-150开始),我想保留5个值.(ggplot 2给我2 - > 50和100)
1)如何更改该图例的比例?例如,在mtc示例中,我只想要2个大小为2和5的点
2)我正在考虑制作以下类别:
mtc$wtCat[which(mtc$wt<=2)]=1
mtc$wtCat[which(mtc$wt>2 & mtc$wt<=3)]=2
mtc$wtCat[which(mtc$wt>3)]=3
p1 <- ggplot(mtc, aes(x = hp, y = mpg))
p2 <- p1 + geom_point(aes(size = wtCat), stat="identity")
print(p2)
Run Code Online (Sandbox Code Playgroud)
然后只需将图例中的1,2,3重命名为<= 2,2-3和> 3,但我也不知道如何做到这一点.
非常感谢.
我有一个data.frame(Data)和这个data.frame(Data2)的子集
set.seed(1)
Data <- data.frame(id = seq(1, 10),
Diag1 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag2 = sample(c("D123", "E123", "F123"), 10, replace = TRUE),
Diag3 = sample(c("G123", "H123", "I123"), 10, replace = TRUE),
Diag4 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag5 = sample(c("J123", "K123", "L123"), 10, replace = TRUE),
Diag6 = sample(c("M123", "N123", "O123"), 10, replace = TRUE),
Diag7 = sample(c("P123", "Q123", "R123"), 10, replace = TRUE))
Data2 <- Data[1:4,]
Run Code Online (Sandbox Code Playgroud)
如何获得两个data.frames的"差异"?我正在寻找Data中但不在Data2中的行.
我认为这样的数据[!Data2]应该有效,但事实并非如此.
谢谢!
我在使用 rvest 进行网页抓取时遇到了一个奇怪的问题。
我刮了以下名称:"Abdichter/in EFZ"起初看起来很正常。但是,当我将文件写入 csv 时,我发现字母之间有“-”。在 Excel 中,这个词看起来像这样:Ab-dich-ter/in EFZ。
所以我做了一个str_split(x, ""),发现字符串实际上是这样的:
c("A", "b", "", "d", "i", "c", "h", "", "t", "e", "r", "/", "i", "n", " ", "E", "F", "Z")
Run Code Online (Sandbox Code Playgroud)
我试图从字符串中取出空字符串,但我没有做到。我试过:
my_string <- str_split(my_string , "")
Run Code Online (Sandbox Code Playgroud)
进而
paste0(my_string[my_string != ""])
Run Code Online (Sandbox Code Playgroud)
但这没有帮助。
因此,我想知道:
编辑:这是网页。
这是我获得字符串的方式:
library(rvest)
read_html("https://berufskunde.com/ausbildungsberufe/ausbildung-abdichter.html", encoding = "UTF-8") %>%
html_nodes(".section") %>%
html_nodes(".text-rot") %>%
html_text()
Run Code Online (Sandbox Code Playgroud) 我有一个 tibble/dataframe ,如下所示:
hc_inpatient_sum hc_ambulant_sum hc_inpatient_mean hc_ambulant_mean
5 2 5.5 2.2
Run Code Online (Sandbox Code Playgroud)
我想要的输出是:
my_names sum mean
hc_inpatient 5 5.5
hc_ambulant 2 2.2
Run Code Online (Sandbox Code Playgroud)
我使用以下代码得到了我想要的。然而,这似乎相当复杂。我猜想使用不太复杂的代码可以获得相同的结果。
library(dplyr)
library(tidyr)
my_data <- tibble(hc_inpatient_sum = 5, hc_ambulant_sum = 2, hc_inpatient_mean = 5.5,
hc_ambulant_mean = 2.2)
res <- my_data %>%
pivot_longer(cols = everything(), names_to = "my_names", values_to = "my_values") %>%
separate(my_names, into = c("my_names", "stats"), sep = "_(?=[^_]+$)") %>%
pivot_wider(names_from = "stats", values_from = "my_values")
Run Code Online (Sandbox Code Playgroud)
有没有更直接的方法使用 tidyr::pivot_longer 获得相同的结果?
或者我可以做这样的事情......
res2 <- pivot_longer(my_data, cols = everything(),
names_to = c(".value", …Run Code Online (Sandbox Code Playgroud)