请考虑以下代码:
import numpy as np a = np.zeros(50) a[10:20:2] = 1 b = c = a[10:40:4] print b.flags # You'll see that b and c are not C_CONTIGUOUS or F_CONTIGUOUS
我的问题:
有没有办法(只提到b)使b和c连续?
如果np.may_share_memory(b,a)在此操作后返回False,则完全正常.
接近但不太合理的事情是:np.ascontiguousarray / np.asfortranarray,因为它们将返回一个新数组.
我的用例是我有一个非常大的3D字段存储在numpy.ndarray的子类中.为了节省内存,我想将这些字段切换到我实际感兴趣处理的域的部分:
a = a[ix1:ix2,iy1:iy2,iz1:iz2]
切片为子类比切片ndarray对象更受限制,但这应该有效并且它将“做正确的事情” – 附加在子类上的各种自定义元数据将按预期转换/保留.不幸的是,由于这会返回一个视图,numpy之后不会释放大数组,所以我实际上并没有在这里保存任何内存.
要完全清楚,我希望完成两件事:
>保留我的类实例上的元数据.切片会起作用,但我不确定其他形式的复制.
>使其成为可以自由地收集原始数组
解决方法
你可以在cython中做到这一点:
In [1]: %load_ext cythonmagic In [2]: %%cython cimport numpy as np np.import_array() def to_c_contiguous(np.ndarray a): cdef np.ndarray new cdef int dim,i new = a.copy() dim = np.PyArray_NDIM(new) for i in range(dim): np.PyArray_STRIDES(a)[i] = np.PyArray_STRIDES(new)[i] a.data = new.data np.PyArray_UpdateFlags(a,np.NPY_C_CONTIGUOUS) np.set_array_base(a,new) In [8]: import sys import numpy as np a = np.random.rand(10,10,10) b = c = a[::2,1::3,2::4] d = a[::2,2::4] print sys.getrefcount(a) to_c_contiguous(b) print sys.getrefcount(a) print np.all(b==d)
输出是:
4 3 True
to_c_contiguous(a)将创建a的c_contiguous副本,并将其作为a的基础.
在调用to_c_contiguous(b)之后,a的refcount减少,当a的refcount变为0时,它将被释放.