我正在处理巨大的卫星数据,我将这些数据分成小块以提供给深度学习模型。我正在使用 pytorch,这意味着数据加载器可以使用多线程。[设置:python,Ubuntu 18.04]
我找不到任何答案在以下之间的数据访问和存储方面是最好的:
多线程多次访问一个文件有什么问题吗?在另一种情况下,拥有那么多文件会产生影响吗?
multithreading bigdata h5py
bigdata ×1
h5py ×1
multithreading ×1