问题如何规范化4D numpy阵列？

我有一个三维numpy图像阵列（CIFAR-10数据集）。图像阵列形状如下所示：

a = np.random.rand(32, 32, 3)

在我深入学习之前，我想对数据进行规范化以获得更好的结果。使用一维数组，我知道我们可以像这样做最小最大规范化：

v = np.random.rand(6)
(v - v.min())/(v.max() - v.min())

Out[68]:
array([ 0.89502294,  0.        ,  1.        ,  0.65069468,  0.63657915,
        0.08932196])

然而，当谈到3D阵列时，我完全迷失了。具体来说，我有以下问题：

沿着哪个轴我们采取最小值和最大值？
我们如何用3D阵列实现这一点？

我感谢您的帮助！

编辑：事实证明我需要使用具有形状的4D Numpy阵列 (202, 32, 32, 3)，因此第一个维度将是图像的索引，最后3个维度是实际图像。如果有人可以为我提供规范化这样一个4D阵列的代码，那就太棒了。谢谢！

编辑2：感谢@ Eric的代码，我已经弄明白了：

x_min = x.min(axis=(1, 2), keepdims=True)
x_max = x.max(axis=(1, 2), keepdims=True)

x = (x - x_min)/(x_max-x_min)

11513

2018-02-25 18:52

起源

您的堆栈是4d（图像#x X x Y x RGB）还是3d（图像＃x X x Y）？ - Paul Panzer

答案:

假设您正在使用形状的图像数据 (W, H, 3)，你应该对每个频道进行标准化（axis=2）另外，如另一个答案所述。

你可以这样做：

# keepdims makes the result shape (1, 1, 3) instead of (3,). This doesn't matter here, but
# would matter if you wanted to normalize over a different axis.
v_min = v.min(axis=(0, 1), keepdims=True)
v_max = v.max(axis=(0, 1), keepdims=True)
(v - v_min)/(v_max - v_min)

2018-02-26 01:13

感谢您的答复！我实际上需要使用4D阵列（我已经更新了我的帖子）。你能提供进一步的指示吗？ - George Liu

由于您的代码，我已经想出了如何做到这一点！ - George Liu

你能否确认一下是否正确？谢谢！ - George Liu

@George：是的，你所拥有的是正确的 - 你在每个图像和通道（轴0和3）的x和y（轴1和2）上取最大值 - Eric

谢谢@Eric！ - George Liu

沿着哪个轴我们采取最小值和最大值？

要回答这个问题，我们可能需要有关您的数据的更多信息，但一般来说，在讨论3个通道图像时，我们会使用每个通道的最小值和最大值进行标准化。这意味着我们将执行3次标准化 - 每个通道一次。这是一个例子：

    img = numpy.random.randint(0, 100, size=(10, 10, 3))  # Generating some random numbers
    img = img.astype(numpy.float32)  # converting array of ints to floats
    img_a = img[:, :, 0]
    img_b = img[:, :, 1]
    img_c = img[:, :, 2]  # Extracting single channels from 3 channel image
    # The above code could also be replaced with cv2.split(img) << which will return 3 numpy arrays (using opencv)

    # normalizing per channel data:
    img_a = (img_a - numpy.min(img_a)) / (numpy.max(img_a) - numpy.min(img_a))
    img_b = (img_b - numpy.min(img_b)) / (numpy.max(img_b) - numpy.min(img_b))
    img_c = (img_c - numpy.min(img_c)) / (numpy.max(img_c) - numpy.min(img_c))

    # putting the 3 channels back together:
    img_norm = numpy.empty((10, 10, 3), dtype=numpy.float32)
    img_norm[:, :, 0] = img_a
    img_norm[:, :, 1] = img_b
    img_norm[:, :, 2] = img_c

编辑：我刚刚想到，一旦你拥有一个通道数据（例如32x32图像），你可以简单地使用：

from sklearn.preprocessing import normalize
img_a_norm = normalize(img_a)

我们如何使用3D阵列？

嗯，这是一个很大的问题。如果你需要像array-wise min和max这样的函数，我会使用Numpy版本。例如，索引是通过轴宽分离器实现的 - 正如您从上面的示例中可以看到的那样。另外，请参阅Numpy的ndarray文档@ https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.html 了解更多。他们真的有一套惊人的n维数组工具。

2018-02-25 19:47

这是规范化的错误方法，你必须从最大值中减去min。即 img_a = (img_a - numpy.min(img_a)) / (numpy.max(img_a) - numpy.min(img_a)) 确保paranthesis是正确的 - smttsp

@smttsp你是绝对正确的，我输入错误，修复我的原始答案。谢谢。 - antonmik

“我们将执行3次规范化 - 每个频道一次” - 对，但这更好地表达为 “正常化 axis=-1“。无需为每个频道重复一次代码 - Eric

r, g, b = cv2.split(img) 也可以写 r, g, b = np.moveaxis(img, -1, 0) - Eric

感谢您的答复！我实际上需要使用4D阵列（我已经更新了我的帖子）。你能提供进一步的指示吗？ - George Liu

问题 如何规范化4D numpy阵列？

答案:

热门问题

问题如何规范化4D numpy阵列？