我有一个包含25个变量和超过200万个观测值的数据集.我的一个变量是我想要拆分的几个不同"类别"的组合,每列显示1个类别(类似于stata中的拆分).例如:
# Name Age Number Events First
# Karen 24 8 Triathlon/IM,Marathon,10k,5k 0
# Kurt 39 2 Half-Marathon,10k 0
# Leah 18 0 1
Run Code Online (Sandbox Code Playgroud)
我希望它看起来像:
# Name Age Number Events_1 Event_2 Events_3 Events_4 First
# Karen 24 8 Triathlon/IM Marathon 10k 5k 0
# Kurt 39 2 Half-Marathon 10k NA NA 0
# Leah 18 0 NA NA NA NA 1
Run Code Online (Sandbox Code Playgroud)
我已经查看了stackoverflow但没有发现任何有效的东西(一切都给我一些错误).任何建议将不胜感激.
注意:可能不重要,但1人的最大类别数是19,因此我需要创建Event_1:Event_19
注释:以前的堆栈溢出建议使用单独的函数,但是此函数似乎不适用于我的数据集.当我输入函数时程序运行但是当它完成时没有任何改变,没有输出,也没有错误代码.当我尝试使用其他线程中提出的其他建议时,我收到了错误消息.但是,我终于通过使用cSplit功能得到了它.谢谢你的帮助!