合并两个数据帧会在 R 中创建额外的行

Question

合并两个数据帧会在 R 中创建额外的行

use*_*293 1 merge join r left-join dplyr

我有两个数据框。

a= 包含数千个不同天气事件观测结果的原始数据集。6000 个观测值

   STATE       EVTYPE
1     AL WINTER STORM
2     AL      TORNADO
3     AL    TSTM WIND
4     AL    TSTM WIND
5     AL    TSTM WIND
6     AL         HAIL
7     AL    HIGH WIND
8     AL    TSTM WIND
9     AL    TSTM WIND
10    AL    TSTM WIND

Run Code Online (Sandbox Code Playgroud)

b= 字典表，其中有大多数天气事件的标准拼写。500 个观测值

    EVTYPE    evmatch
71         DUST DEVEL DUST DEVIL
72         DUST DEVIL DUST DEVIL
73         DUST DEVIL DUST DEVIL
74         DUST STORM DUST STORM
75        EARLY FROST       <NA>
76         EARLY RAIN       <NA>

Run Code Online (Sandbox Code Playgroud)

两者都合并df_new为evtype

library(dplyr)
df_new <- left_join(a, b, by = c("EVTYPE"))
STATE       EVTYPE           evmatch
1     AL WINTER STORM      WINTER STORM
2     AL      TORNADO           TORNADO
3     AL    TSTM WIND THUNDERSTORM WIND
4     AL    TSTM WIND THUNDERSTORM WIND
5     AL    TSTM WIND THUNDERSTORM WIND
6     AL         HAIL              HAIL
7     AL    HIGH WIND         HIGH WIND
8     AL    TSTM WIND THUNDERSTORM WIND
9     AL    TSTM WIND THUNDERSTORM WIND
10    AL    TSTM WIND THUNDERSTORM WIND
11    AL   HEAVY RAIN        HEAVY RAIN
12    AL  FLASH FLOOD       FLASH FLOOD
13    AL    TSTM WIND THUNDERSTORM WIND
14    AL   HEAVY RAIN        HEAVY RAIN
15    AL    TSTM WIND THUNDERSTORM WIND

Run Code Online (Sandbox Code Playgroud)

当我将两者结合起来时，我最终得到的数据集比原始数据集具有更多的 obs。

iea有6000个obs，df_new有69400个。

如何合并两个数据集，以便生成的 df 与原始数据帧相同。