我正在尝试从R切换到Python(主要是关于一般灵活性的问题).使用Numpy,matplotlib和ipython,除了合并"数据集"之外,我还能够覆盖我的所有用例.我想纯粹在python中模拟SQL的join by子句(inner,outer,full).R使用'merge'函数处理它.
我已经尝试了numpy.lib.recfunctions join_by,但它与'key'重复的关键问题:
join_by(key, r1, r2, jointype='inner', r1postfix='1', r2postfix='2',
defaults=None, usemask=True, asrecarray=False)
Run Code Online (Sandbox Code Playgroud)
加入数组r1和r2键key.
密钥应该是字符串或与用于连接数组的字段对应的字符串序列.如果key在两个输入数组中找不到该字段,则会引发异常.
既不存在r1也不r2应该有任何重复key:重复的存在将使输出非常不可靠.请注意,算法不会查找重复项.
来源:http://presbrey.mit.edu:1234/numpy.lib.recfunctions.html
任何指针或帮助将非常感谢!