为了改进模型,我将几个 .query() 传递给 pandas 数据框。在 for 循环中,我也希望有一个空查询,但在文档中没有找到任何内容。它应该返回完整的数据帧。
我试过:
temp_df.query(None)
temp_df.query()
Run Code Online (Sandbox Code Playgroud)
但这是行不通的。还有其他想法吗?
谢谢
在 anacondas py3.6 安装中的 ubuntu 服务器(100GB RAM)上以这种方式在 for 循环(7 个文件 * 4GB)中打开多个文件后出现此错误:
temp_df = pd.read_csv(datafolder + str(file), encoding="ISO-8859-1", delimiter=';',low_memory=False)
这是错误,它在我设置后出现
低内存=假
当 low_memory = True 时不会发生
* `python' 中的错误:free():无效指针:0x00007fc3c90dc98e *
任何想法?谢谢
例如,在不平衡分类(使用 scikit-learn)中,平衡类(即将 class_weight 设置为平衡)与使用 SMOTE 进行过采样有什么区别?一个与另一个的预期效果是什么?