使用 scipy.io 将 python pandas dataframe 转换为 matlab 结构

mat*_*mlw 5 python matlab pandas

我正在尝试使用 scipy.io 将 pandas 数据帧保存到 matlab .mat 文件。

我有以下内容:

array1 = np.array([1,2,3])
array2 = np.array(['a','b','c'])
array3 = np.array([1.01,2.02,3.03])
df = DataFrame({1:array1, 2:array2,3:array3}, index=('array1','array2','array3'))
recarray_ = df.to_records()
## Produces:
# rec.array([('array1', 1, 'a', 1.01), ('array2', 2, 'b', 2.02),
#   ('array3', 3, 'c', 3.03)], 
#  dtype=[('index', 'O'), ('1', '<i4'), ('2', 'O'), ('3', '<f8')])
scipy.io.savemat('test_recarray_struct.mat', {'struct':df.to_records()})
Run Code Online (Sandbox Code Playgroud)

在Matlab中,我希望它生成一个包含三个数组(一个int、一个char、一个float)的结构体,但它实际上生成一个包含另外3个结构体的结构体,每个结构体包含四个变量;'index', 1, '2', 3。当尝试选择 1、'2' 或 3 时,出现错误“变量 struct(1, 1).# 不存在。”

谁能解释预期的行为以及如何最好地将 DataFrame 保存到 .mat 文件?

mat*_*mlw 4

与此同时,我正在使用以下解决方法。如果您有更好的解决方案,请告诉我:

a_dict = {col_name : df[col_name].values for col_name in df.columns.values}

## optional if you want to save the index as an array as well:
# a_dict[df.index.name] = df.index.values
scipy.io.savemat('test_struct_to_mat.mat', {'struct':a_dict})
Run Code Online (Sandbox Code Playgroud)