问题 Numpy：通过多维数组对多维数组进行排序

如果这是多余的或超级基本的，请原谅我。我是从R来到Python / Numpy并且很难在脑子里翻看东西。

我有一个n维数组，我想用另一个索引值的n维数组排序。我知道我可以将它包装在一个循环中，但似乎应该有一种非常简洁的Numpyonic方式将其击败。这是我设置n = 2的问题的示例代码：

a1 = random.standard_normal(size=[2,5]) 
index = array([[0,1,2,4,3] , [0,1,2,3,4] ])

所以现在我有一个2 x 5的随机数组和一个2 x 5的索引。我已经阅读了帮助 take() 现在大约10次，但显然我的大脑并没有去研究它。

我以为这可能会让我在那里：

take(a1, index)

array([[ 0.29589188, -0.71279375, -0.18154864, -1.12184984,  0.25698875],
       [ 0.29589188, -0.71279375, -0.18154864,  0.25698875, -1.12184984]])

但这显然只是重新排序第一个元素（我假设因为扁平化）。

有关我如何从我所处的位置获得的解释，该解决方案将索引的元素0对a1的元素0进行排序...元素n？

~~我想不出如何在N维度上工作，但是~~ 这是2D版本：

>>> a = np.random.standard_normal(size=(2,5))
>>> a
array([[ 0.72322499, -0.05376714, -0.28316358,  1.43025844, -0.90814293],
       [ 0.7459107 ,  0.43020728,  0.05411805, -0.32813465,  2.38829386]])
>>> i = np.array([[0,1,2,4,3],[0,1,2,3,4]]) 
>>> a[np.arange(a.shape[0])[:,np.newaxis],i]
array([[ 0.72322499, -0.05376714, -0.28316358, -0.90814293,  1.43025844],
       [ 0.7459107 ,  0.43020728,  0.05411805, -0.32813465,  2.38829386]])

这是N维版本：

>>> a[list(np.ogrid[[slice(x) for x in a.shape]][:-1])+[i]]

以下是它的工作原理：

好的，让我们从三维数组开始进行说明。

>>> import numpy as np
>>> a = np.arange(24).reshape((2,3,4))
>>> a
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

您可以通过指定沿每个轴的索引来访问此数组的元素，如下所示：

>>> a[0,1,2]
6

这相当于 a[0][1][2] 如果我们处理列表而不是数组，那么你将如何访问相同的元素。

Numpy允许您在切片数组时变得更加漂亮：

>>> a[[0,1],[1,1],[2,2]]
array([ 6, 18])
>>> a[[0,1],[1,2],[2,2]]
array([ 6, 22])

这些例子相当于 [a[0][1][2],a[1][1][2]] 和 [a[0][1][2],a[1][2][2]] 如果我们处理清单。

你甚至可以省略重复的指数，而numpy会找出你想要的东西。例如，上面的例子可以等效地写成：

>>> a[[0,1],1,2]
array([ 6, 18])
>>> a[[0,1],[1,2],2]
array([ 6, 22])

您在每个维度中切片的数组（或列表）的形状仅影响形状返回的数组。换句话说，numpy并不关心您是否尝试使用形状数组索引数组 (2,3,4) 当它拉动值时，除了它会为你提供一系列形状 (2,3,4)。例如：

>>> a[[[0,0],[0,0]],[[0,0],[0,0]],[[0,0],[0,0]]]
array([[0, 0],
       [0, 0]])

在这种情况下，我们抓住相同的元素， a[0,0,0] 一遍又一遍，但是numpy正在返回一个与我们传入的形状相同的数组。

好的，你的问题。你想要的是沿着最后一个轴索引数组中的数字 index 阵列。所以，对于您想要的问题中的示例 [[a[0,0],a[0,1],a[0,2],a[0,4],a[0,3]],a[1,0],a[1,1],...

像我之前所说的那样，你的索引数组是多维的这一事实，并没有告诉我们你想从哪里获取这些索引的任何内容;它只是指定输出数组的形状。因此，在您的示例中，您需要告诉numpy要从中拉出前5个值 a[0] 而后者则来自 a[1]。简单！

>>> a[[[0]*5,[1]*5],index]

它在N维中变得复杂，但让我们为三维数组做这件事 a 我在上面定义了方法。假设我们有以下索引数组：

>>> i = np.array(range(4)[::-1]*6).reshape(a.shape)
>>> i
array([[[3, 2, 1, 0],
        [3, 2, 1, 0],
        [3, 2, 1, 0]],

       [[3, 2, 1, 0],
        [3, 2, 1, 0],
        [3, 2, 1, 0]]])

因此，这些值都是针对最后一个轴的索引。我们需要告诉numpy这些数字取自第一轴和第二轴的索引;即我们需要告诉numpy第一轴的索引是：

i1 = [[[0, 0, 0, 0],
       [0, 0, 0, 0],
       [0, 0, 0, 0]],

      [[1, 1, 1, 1],
       [1, 1, 1, 1],
       [1, 1, 1, 1]]]

而第二轴的指数是：

i2 = [[[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2]],

      [[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2]]]

然后我们可以这样做：

>>> a[i1,i2,i]
array([[[ 3,  2,  1,  0],
        [ 7,  6,  5,  4],
        [11, 10,  9,  8]],

       [[15, 14, 13, 12],
        [19, 18, 17, 16],
        [23, 22, 21, 20]]])

生成的方便的numpy功能 i1 和 i2 叫做 np.mgrid。我用 np.ogrid 在我的答案中，由于我之前谈到的那种笨拙的魔法，在这种情况下是相同的。

希望有所帮助！

今天玩了这个以后我发现如果我使用mapper函数和take我可以解决2维版本真的像这样：

a1 = random.standard_normal(size=[2,5]) 
index = array([[0,1,2,4,3] , [0,1,2,3,4] ]) 
map(take, a1, index)

我需要 map() 该 take() 对于每个元素 a1

当然，接受的答案解决了n维版本。但回想起来，我确定我并不需要n维解决方案，只需要2-D版本。

所以，如果我理解正确，你想重新排序每个“行” a1 使用每行中的索引 index？换句话说a1take（index）如果你是1D，但每行都这样做？ - Wes McKinney

对。因此，将a1的第一行按索引的第一行和a1的第二行按第二行索引排序。随着a1增长到维度n，那么索引也是如此。 - JD Long

我想你钉了我想做的事。非常感谢！不要过分贪心，但你能解释一下n维版本的作用吗？我一直在玩它，但我不喜欢这个动作。 - JD Long

没问题。顺便提一句，我添加了一个解释，这个解释要花费更长的时间才能找出答案！ - user545424

你，先生，值得一枚奖牌！谢谢你的精彩回答。 - JD Long

问题 Numpy：通过多维数组对多维数组进行排序

答案:

热门问题