小编use*_*906的帖子

如何在 python 中打开 .snappy.parquet 文件？

如何在 python 3.5 中打开 .snappy.parquet 文件？到目前为止，我使用了这个代码：

import numpy
import pyarrow

filename = "/Users/T/Desktop/data.snappy.parquet" 
df = pyarrow.parquet.read_table(filename).to_pandas()

Run Code Online (Sandbox Code Playgroud)

但是，它给出了这个错误：

AttributeError: module 'pyarrow' has no attribute 'compat'

Run Code Online (Sandbox Code Playgroud)

PS我以这种方式安装了pyarrow：

pip install pyarrow

Run Code Online (Sandbox Code Playgroud)

python snappy parquet

use*_*906

lucky-day

6
推荐指数

3
解决办法

6816
查看次数

用NaN替换字典的空值

我有一个缺少值的字典(密钥在那里,但相关的值是空的).例如,我想要下面的字典:

dct = {'ID':'', 'gender':'male', 'age':'20', 'weight':'', 'height':'5.7'}

Run Code Online (Sandbox Code Playgroud)

要改为这种形式:

dct = {'ID':NaN, 'gender':'male', 'age':'20', 'weight':NaN, 'height':'5.7'}

Run Code Online (Sandbox Code Playgroud)

我怎样才能以最省时的方式写出来呢？

python dictionary missing-data

use*_*906

2018 03-12

4
推荐指数

1
解决办法

3665
查看次数

将包含字符串数组的 .mat 文件加载到 Python 3.6

我有一个 .mat 文件，其中包含两个字符串格式的 DateTime 数组。数组就像：

A = ["15-Nov-2014 22:42:16",
         "16-Dec-2014 04:14:07",
         "20-Jan-2015 17:05:32"]

Run Code Online (Sandbox Code Playgroud)

我将两个字符串数组保存在 .mat 文件中。我尝试使用以下命令在 Python 中加载它们：

import hdf5storage
Input = hdf5storage.loadmat('Input.mat')

Run Code Online (Sandbox Code Playgroud)

或这个命令：

import scipy
Input = scipy.io.loadmat('Input.mat')

Run Code Online (Sandbox Code Playgroud)

两者都会导致读取 Python 中的字典，这是预期的，但我看不到两个数组的名称作为字典键。

有任何想法吗？

python string matlab

use*_*906

2020 01-08

4
推荐指数

1
解决办法

1690
查看次数

mlr3 rpart学习器中未定义变量重要性

我在 R 中使用 mlr3 包训练并测试了决策树分类器：

pred_probability = learner_DT$train(task_train)$predict(task_test)

我怎样才能从这个模型中获得变量重要性？我试过了，learner_DT$importance()但结果是named numeric(0)

任何帮助表示赞赏。

r decision-tree mlr3

use*_*906

lucky-day

1
推荐指数

1
解决办法

160
查看次数

标签统计

python ×3

decision-tree ×1

dictionary ×1

matlab ×1

missing-data ×1

mlr3 ×1

parquet ×1

r ×1

snappy ×1

string ×1

如何在 python 中打开 .snappy.parquet 文件？

用NaN替换字典的空值

将包含字符串数组的 .mat 文件加载到 Python 3.6

mlr3 rpart学习器中未定义变量重要性

标签 统计

小编use_906的帖子

标签统计