我正在开展一个项目,根据不同国家/地区的体育比赛结果分析国家/地区内个人层面的调查数据,但我不确定产生我想要的合并的最有效方法是什么。
我正在处理两个单独的数据集。一种包含嵌套在国家/地区内的个人级数据。数据可能如下所示:
country <- c(rep("Country A", 4), rep("Country B", 6))
date <- c("2000-01-01", "2000-01-02", "2000-01-03", "2000-01-04", rep("2000-01-01", 2), "2000-01-02", rep("2000-01-03", 3))
outcome <- rnorm(10)
individual_data <- cbind.data.frame(country, date, outcome)
rm(country, date, outcome)
Run Code Online (Sandbox Code Playgroud)
另一个有国家比赛级别的数据,看起来像这样:
date <- rep("2000-01-02", 2)
country <- c("Country A", "Country B")
opponent <- c("Country B", "Country A")
match_outcome <- c("L", "W")
match_data <- cbind.data.frame(date, country, opponent, match_outcome)
rm(date, country, opponent, match_outcome)
Run Code Online (Sandbox Code Playgroud)
在这个例子中,只有一场比赛是在 2000 年 1 月 2 日进行的,其中 A 国输给了 B 国。我想执行一个fuzzy_join与left_join这里相反的match_data比赛, …