现状:
我有一个CSV文件A有两列Customer ID和Entry date.
A包含大约1.500.000个观测值.
我有另一个B包含单列的CSV文件Customer ID.
B是一个较小的子集A.
目标:
由于表中缺少有关其输入日期的信息B,我希望从表中获取该信息A并将其全部写入新表中C.
当前进展:
我已经A从每个子集创建了10个子集S1,...,S10 最大客户ID.在for循环中,我遍历所有条目B并检查是否B位于其中一个子集中(通过customer ID和max c ID子集).一旦我找到了我应该找到客户ID的子集,我就使用该函数which在A中查找B的元素.
这非常慢.
是不是还有另一种更快的方法?
在R中使用CSV文件的最佳对象当前A是数据帧,并且B是一个大整数.