csr_matrix(Compressed Sparse Row matrix)存储模式浅析
2016-08-14 11:05
363 查看
压缩稀疏矩阵的某种存储方式(开始不是很懂,后来发现网上解释的也不是很清楚,故来解释一发。以下为官方的例子)
此处官方文档介绍传送门
(注:论文的行下标和列下标均从0开始)
data 表示 元数据 显然为1, 2, 3, 4, 5, 6
shape 表示 矩阵的形状 为 3 * 3
indices 表示 各个数据在各行的下标, 从该数据我们可以知道:数据1在某行的0位置处, 数据2在某行的2位置处,6在某行的2位置处。
而各个数据在哪一行就要通过indptr参数得到的
indptr 表示每行数据的个数:[0 2 3 6]表示从第0行开始数据的个数,0表示默认起始点,0之后有几个数字就表示有几行,第一个数字2表示第一行有2 - 0 = 2个数字,因而数字1,2都第0行,第二行有3 - 2 = 1个数字,因而数字3在第1行,以此类推,我们能够知道所有数字的行号
Example: 数字6 ,indptr推出在第2行,indices推出在第2列。
(若有不正,敬请指出)
此处官方文档介绍传送门
>>> indptr = np.array([0, 2, 3, 6]) >>> indices = np.array([0, 2, 2, 0, 1, 2]) >>> data = np.array([1, 2, 3, 4, 5, 6]) >>> csr_matrix((data, indices, indptr), shape=(3, 3)).toarray() array([[1, 0, 2], [0, 0, 3], [4, 5, 6]])
(注:论文的行下标和列下标均从0开始)
data 表示 元数据 显然为1, 2, 3, 4, 5, 6
shape 表示 矩阵的形状 为 3 * 3
indices 表示 各个数据在各行的下标, 从该数据我们可以知道:数据1在某行的0位置处, 数据2在某行的2位置处,6在某行的2位置处。
而各个数据在哪一行就要通过indptr参数得到的
indptr 表示每行数据的个数:[0 2 3 6]表示从第0行开始数据的个数,0表示默认起始点,0之后有几个数字就表示有几行,第一个数字2表示第一行有2 - 0 = 2个数字,因而数字1,2都第0行,第二行有3 - 2 = 1个数字,因而数字3在第1行,以此类推,我们能够知道所有数字的行号
Example: 数字6 ,indptr推出在第2行,indices推出在第2列。
(若有不正,敬请指出)
相关文章推荐
- CSR(compressed sparse row matrix)
- 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)
- 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)
- 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)
- 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)
- 利用scipy.sparse.csr_matrix构建term-document矩阵
- 利用scipy.sparse.csr_matrix构建term-document矩阵
- sparse.csr_matrix矩阵的压缩存储
- 浅析目前常见的三大存储模式
- 利用scipy.sparse.csr_matrix构建term-document矩阵
- 三元组实现稀疏矩阵的压缩存储与转置 (Sparse matrix compression storage and transposition base on triple)
- 利用scipy.sparse.csr_matrix构建term-document matrix
- scipy.sparse中csc_martrix和csr_matrix两个稀疏矩阵的区别
- 稀疏矩阵Compressed Row Storage存储格式
- Save / load scipy array,sparse csr_matrix
- 稀疏矩阵存储格式CSC(Compressed Sparse Columns Format)
- 稀疏矩阵的存储格式(Sparse Matrix Storage Formats)
- Oracle基本数据类型存储格式浅析(五)——RAW类型
- Oracle基本数据类型存储格式浅析(一)——字符类型
- 装饰模式浅析(1)