我想用 Python 将 3 通道 RGB 图像转换为索引图像。它用于处理训练深度网络以进行语义分割的标签。我所说的索引图像是指它有一个通道,每个像素都是索引,索引应该从零开始。当然,它们应该具有相同的尺寸。转换基于 Python 字典中的以下映射:
\n\ncolor2index = {\n (255, 255, 255) : 0,\n (0, 0, 255) : 1,\n (0, 255, 255) : 2,\n (0, 255, 0) : 3,\n (255, 255, 0) : 4,\n (255, 0, 0) : 5\n }\nRun Code Online (Sandbox Code Playgroud)\n\n我已经实现了一个简单的功能:
\n\ndef im2index(im):\n """\n turn a 3 channel RGB image to 1 channel index image\n """\n assert len(im.shape) == 3\n height, width, ch = im.shape\n assert ch == 3\n m_lable = np.zeros((height, width, 1), …Run Code Online (Sandbox Code Playgroud)