小编use*_*906的帖子

如何在 python 中打开 .snappy.parquet 文件?

如何在 python 3.5 中打开 .snappy.parquet 文件?到目前为止,我使用了这个代码:

import numpy
import pyarrow

filename = "/Users/T/Desktop/data.snappy.parquet" 
df = pyarrow.parquet.read_table(filename).to_pandas()
Run Code Online (Sandbox Code Playgroud)

但是,它给出了这个错误:

AttributeError: module 'pyarrow' has no attribute 'compat'
Run Code Online (Sandbox Code Playgroud)

PS我以这种方式安装了pyarrow:

pip install pyarrow
Run Code Online (Sandbox Code Playgroud)

python snappy parquet

6
推荐指数
3
解决办法
6816
查看次数

用NaN替换字典的空值

我有一个缺少值的字典(密钥在那里,但相关的值是空的).例如,我想要下面的字典:

dct = {'ID':'', 'gender':'male', 'age':'20', 'weight':'', 'height':'5.7'}
Run Code Online (Sandbox Code Playgroud)

要改为这种形式:

dct = {'ID':NaN, 'gender':'male', 'age':'20', 'weight':NaN, 'height':'5.7'}
Run Code Online (Sandbox Code Playgroud)

我怎样才能以最省时的方式写出来呢?

python dictionary missing-data

4
推荐指数
1
解决办法
3665
查看次数

将包含字符串数组的 .mat 文件加载到 Python 3.6

我有一个 .mat 文件,其中包含两个字符串格式的 DateTime 数组。数组就像:

A = ["15-Nov-2014 22:42:16",
         "16-Dec-2014 04:14:07",
         "20-Jan-2015 17:05:32"]
Run Code Online (Sandbox Code Playgroud)

我将两个字符串数组保存在 .mat 文件中。我尝试使用以下命令在 Python 中加载它们:

import hdf5storage
Input = hdf5storage.loadmat('Input.mat')
Run Code Online (Sandbox Code Playgroud)

或这个命令:

import scipy
Input = scipy.io.loadmat('Input.mat')
Run Code Online (Sandbox Code Playgroud)

两者都会导致读取 Python 中的字典,这是预期的,但我看不到两个数组的名称作为字典键。

有任何想法吗?

python string matlab

4
推荐指数
1
解决办法
1690
查看次数

mlr3 rpart学习器中未定义变量重要性

我在 R 中使用 mlr3 包训练并测试了决策树分类器:

pred_probability = learner_DT$train(task_train)$predict(task_test)

我怎样才能从这个模型中获得变量重要性?我试过了,learner_DT$importance()但结果是named numeric(0)

任何帮助表示赞赏。

r decision-tree mlr3

1
推荐指数
1
解决办法
160
查看次数

标签 统计

python ×3

decision-tree ×1

dictionary ×1

matlab ×1

missing-data ×1

mlr3 ×1

parquet ×1

r ×1

snappy ×1

string ×1