我有一个 python 脚本,它使用 pyarrow 读取镶木地板文件。我正在尝试循环遍历表以更新其中的值。如果我尝试这个:
for col_name in table2.column_names:
if col_name in my_columns:
print('updating values in column ' + col_name)
col_data = pa.Table.column(table2, col_name)
row_ct = 1
for i in col_data:
pa.Table.column(table2, col_name)[row_ct] = change_str(pa.StringScalar.as_py(i))
row_ct += 1
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
TypeError: 'pyarrow.lib.ChunkedArray' object does not support item assignment
Run Code Online (Sandbox Code Playgroud)
我如何更新这些值?
我尝试使用pandas,但它无法处理原始表中的空值,并且它还错误地转换了原始表中列的数据类型。pyarrow 有本地编辑数据的方法吗?