您的位置:首页 > 其它

图像处理基本概念、术语

2016-01-07 15:06 316 查看
time domain:时域, 如speech signal;spatial domain: 空域, 如image

transform domain:变换域, 如傅里叶域的傅里叶系数,小波域的小波系数

corpus:预料库(文本建模基本术语),一般由多篇文档构成的可称为预料库,记一篇文档 d=w⃗ =(w1,w2,…,wn)(由 n个单词构成);

signal corruption:noise, missing data and outliers.

on many benchmark visual datasets for different tasks

performance metrics(性能度量)

streaming workflows with pipelines

1. 计算机视觉的挑战

viewpoint variation:视角

scale variation:尺度

deformation:变形

occlusion:遮挡

illumination conditions:照明

background clutter:前景背景混淆

Intra-class variation:类内的差异



2. DC(direct current)

直流。

一个图像块的 DC,通常意味着其均值。还记得二维傅里叶变换,

F(u,v)=∑x∑yf(x,y)e−i2π(ux/M+vy/N)

其在(0, 0)(频率原点),

F(0,0)=∑x∑yf(x,y)

就对应着直流分量。

3. Population Sparsity(种群稀疏) vs Lifetime Sparsity(存在稀疏)

Fn×m=Wn×d⋅Xd×m

d:表示原有的特征空间

n:变换后的特征空间

m:样本的数目

F:特征矩阵(Feature Matrix)

每个样本都只用很少的激活(非零)特征来描述。具体来说,对于特征矩阵的每一列(一个样本)f(i),只有很少的非零元素。其他的都是0 。例如,一幅图像可以由里面包含的一些目标来描述,如果里面存在很多可能的目标,那么在某一时刻,也只可能出现一些。我们称之为population sparsity(种群稀疏)。

好的特征应该是具有区分性的,这样才可以区分样本。例如需要区分人脸和人手,那么很明显,肤色不是区分性的特征,因为人脸和人手都有肤色。但如果看有没有眼睛,那么就很容易区分是人脸还是人手了,所以眼睛就是一个区分性的特征。所以要区分样本,就要选择样本独有的,而不是大家都有的特征。稍微学术点的表达就是,每个特征只允许在少量的样本内被激活。也就是说,在特征矩阵中,每一行(一种特征)应该只有少量的非零元素。这个特征的属性被称为lifetime sparsity(存在稀疏)。

4. High Dispersal(高分散性)

对每一行(一种特征在不同样本的时候的不同取值)的特征的分布,应该和其他行的特征的分布相似,或者说每种特征都应该具有相似的统计特性。具体来说,对矩阵的每一行,我们取该行所有元素(一种特征在不同样本的时候的不同取值)的平方后的均值作为其统计特性的描述。每一行都存在一个均值,那么每行的均值都应该是一样的,这样就可以认为所有的特征都具有相似的分布。这种属性我们称之为 high dispersal(高分散性)。但对于一个好的特征描述来说,这个属性并不是必要的。但它可以防止特征的退化,也就是可以防止提取到相同的特征(如果提取到相同的特征,那么特征既冗余,又没有增加信息量,所以一般都要求提取到的特征是正交的)。对于过完备的特征表达。high dispersal 可以理解为只有很少的 inactive 不活跃的特征。例如,PCA编码一般不会满足 high dispersal,因为大的特征值对应的特征向量(也就是特征code)大部分总是活跃active的。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: