Pet*_*ine 5 python numpy pandas
题
我无法识别numpy.int64对象,以便将它们转换为用于 json 序列化的基本 python int。isinstance通常有效,但在以下示例中无效,我很想了解为什么会这样。
>>> x
0
>>> type(x)
<class 'numpy.int64'>
>>> import numpy
>>> isinstance(x, numpy.int64)
False
Run Code Online (Sandbox Code Playgroud)
语境
上面的 x 来自我的应用程序,由to_dict熊猫数据帧生成。各种数据帧用于生成结果,因此我不能只使用熊猫to_json。
从如何识别 python 中的 numpy 类型中获取提示?,我实际上已经成功地检测到这些项目(有时根本不是 numpy 对象),使用以下方法:
>>> (isinstance(x, (pd.np.ndarray, pd.np.generic)) and
>>> pd.np.issubdtype(x, pd.np.dtype('int64')))
True
Run Code Online (Sandbox Code Playgroud)
但是如果有人能解释为什么第一个选项不起作用,我将非常感激,这样我就可以有足够的信心将其部署到我们的生产系统中。使用simplejson和使用的自定义JSONDecoder类isinstance(obj, pd.np.int64)已经工作了几个月,但它突然停止使用上面的示例。
pickle.dumps(x) 给 b'\x80\x03cnumpy.core.multiarray\nscalar\nq\x00cnumpy\ndtype\nq\x01X\x02\x00\x00\x00i8q\x02K\x00K\x01\x87q\x03Rq\x04(K\x03X\x01\x00\x00\x00<q\x05NNNJ\xff\xff\xff\xffJ\xff\xff\xff\xffK\x00tq\x06bC\x08\x00\x00\x00\x00\x00\x00\x00\x00q\x07\x86q\x08Rq\t.'
有趣的是,酸洗对象似乎解决了这个问题。
>>> isinstance(pickle.loads(pickle.dumps(x)), pd.np.int64)
True
Run Code Online (Sandbox Code Playgroud)