稀疏矩阵存储格式
2016-08-08 09:52
483 查看
当运算数据数量很大且稀疏的时候,使用稀疏的数据存储格式可以节省大量的存储空间且加快计算速度。本文介绍三种比较常见的稀疏矩阵表示方式:COO(Coordinate Format坐标表示),CSR(Compressed Sparse Row行压缩),CSC(Compressed Sparse Column列压缩)。
1、COO:Coordinate Format COO格式使用行下标、列下标和数据值三元组来表示每个非零元素,所以总共需要保存非零元素个数的三倍个值
row_idx 和col_idx 指定values 中每个数据对应的行下标和列下标。
2、 CSR:Compressed Sparse Row CSR格式的列下标向量和数据值向量与COO格式类似,在行下标表示上做了压缩。根据数据的排列规则,只需要指定在哪个数据换到下一行就行。
把非零数据排成一列,并从0开始建立索引,row_ptr指定在哪个索引位置进行换行。例如,稀疏矩阵的第二行是1,那么就在索引2处进行切割。
3、 CSC:Compressed Sparse Column CSC格式的行下标和数据值向量与COO格式类似,在列下标上做了压缩。根据数据的排列规则,只需要指定在哪个数据换到下一列就行。
把非零数据排成一列,并从0开始建立索引,col_ptr指定在哪个索引位置进行换行。例如,稀疏矩阵的第二列是1、3,那么就在索引2处进行切割。注意到CSC的数据是按列顺序排列,和CSR有所不同。
4、其他还有一些比较特殊的稀疏矩阵表示形式,都是根据稀疏矩阵的特性进行压缩,例如对称矩阵,块矩阵等等。在此不进一步讨论。
1、COO:Coordinate Format COO格式使用行下标、列下标和数据值三元组来表示每个非零元素,所以总共需要保存非零元素个数的三倍个值
>>> import scipy >>> import numpy as np >>> row_idx = np.array([0,0,1,2,2,3,3,3]) >>> col_idx = np.array([0,3,1,2,3,0,1,3]) >>> values = np.array([4,2,1,5,7,6,3,8]) >>> coo_mat = scipy.sparse.coo_matrix((values, (row_idx , col_idx)),shape = (4,4)).toarray() >>> coo_mat array([[4, 0, 0, 2], [0, 1, 0, 0], [0, 0, 5, 7], [6, 3, 0, 8]])
row_idx 和col_idx 指定values 中每个数据对应的行下标和列下标。
2、 CSR:Compressed Sparse Row CSR格式的列下标向量和数据值向量与COO格式类似,在行下标表示上做了压缩。根据数据的排列规则,只需要指定在哪个数据换到下一行就行。
>>> col_idx = np.array([0,3,1,2,3,0,1,3]) >>> values = np.array([4,2,1,5,7,6,3,8]) >>> row_ptr = np.array([0,2,3,5,8]) >>> csr_mat = scipy.sparse.csr_matrix((values,col_idx, row_ptr),shape=(4,4)).toarray() >>> csr_mat array([[4, 0, 0, 2], [0, 1, 0, 0], [0, 0, 5, 7], [6, 3, 0, 8]])
把非零数据排成一列,并从0开始建立索引,row_ptr指定在哪个索引位置进行换行。例如,稀疏矩阵的第二行是1,那么就在索引2处进行切割。
3、 CSC:Compressed Sparse Column CSC格式的行下标和数据值向量与COO格式类似,在列下标上做了压缩。根据数据的排列规则,只需要指定在哪个数据换到下一列就行。
>>> values = np.array([4,6,1,3,5,2,7,8]) >>> row_idx = np.array([0,3,1,3,2,0,2,3]) >>> col_ptr = np.array([0,2,4,5,8]) >>> csc_mat = scipy.sparse.csc_matrix((values,row_idx,col_ptr),shape=(4,4)).toarray() >>> csc_mat array([[4, 0, 0, 2], [0, 1, 0, 0], [0, 0, 5, 7], [6, 3, 0, 8]])
把非零数据排成一列,并从0开始建立索引,col_ptr指定在哪个索引位置进行换行。例如,稀疏矩阵的第二列是1、3,那么就在索引2处进行切割。注意到CSC的数据是按列顺序排列,和CSR有所不同。
4、其他还有一些比较特殊的稀疏矩阵表示形式,都是根据稀疏矩阵的特性进行压缩,例如对称矩阵,块矩阵等等。在此不进一步讨论。
相关文章推荐
- 稀疏矩阵 存储格式 COO CSR DIA ELL HYB
- 稀疏矩阵存储格式
- 稀疏矩阵的存储格式 之 CSR/CSC
- 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)
- 稀疏矩阵的存储格式(转)
- 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式CSC(Compressed Sparse Columns Format)
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结
- 稀疏矩阵存储格式的整理
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB
- 稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB