我正在Stata中合并两个数据集,并提出了一个潜在的问题.
我计划sort
以完全相同的方式在每个数据集上对两组数据共有的几个分类变量进行计划.但是,有几个分类变量在一个数据集中存在更多类别而在另一个数据集中存在.我已经足够小心,以确保两个数据集中的编码匹配(例如,红色在数据集A和B中编码为1,但数据集A仅有红色,绿色和蓝色,而数据集B有红色,绿色,蓝色和黄色).
如果我sort
每个数据集以同样的方式和generate
一个id
变量(gen id = _n
),并merge
在这一点,我会遇到什么问题?