我刚刚开始冒险,DASK就在json格式的示例数据集上学习。我知道对于初学者来说,这不是世界上最简单的数据格式:)
我有一个json格式的数据集。我通过dd.read_json将数据加载到数据帧,一切顺利。例如,compute()或len()函数出现了问题。
我收到此错误:
ValueError: Metadata mismatch found in `from_delayed`.
Partition type: `DataFrame`
+----------+-------+----------+
| Column | Found | Expected |
+----------+-------+----------+
| column1 | - | object |
| column2 | - | object |
+----------+-------+----------+
Run Code Online (Sandbox Code Playgroud)
我尝试了不同的方法,但没有任何帮助。我不知道该如何处理该错误。
请帮助,我将非常感谢!