您的位置：首页 > 其它

上海会议总结

2015-07-03 21:05 225 查看

稀疏表示

动力和目的

随着数据巨大的增长，维度的提高，需要从大量的数据中提取有用的信息。主要的挑战就是高效地从高维数据中获取低维结构的数据，而降维的过程也必然带来错误。

有效的优化—稀疏表示

（部分源于知名博主）

稀疏表示最重要的思想即是，在一个足够大的训练样本空间内，对于一个类别的物体，
  可以大致的由训练样本中同类的样本子空间线性表示，因此在当该物体有整个样本空间表示时，
  其表示的系数是稀疏的。这是稀疏表示思想最重要的一个假设，当然这也是之后进一步分析的基础。
  通过上述对稀疏表示思想的大致描述，可以将稀疏表示抽象成一个方程式：
y=Ax，(1)
当然稀疏指的是这个方程的系数向量x是稀疏的。y是目标样本，A为训练样本空间。
因此，解决上述问题就是要求解上述方程，要求是x是稀疏的。即：
x0=argmin||x||o   s.t.  y=Ax;(2)
||x||o，指的是x的0范数，即x中非零元素的个数。而求解0范数是一个NP-hard问题，
但是在x是足够稀疏的条件下，可以将上述问题转化为求解x的1范数，即||x||1，
x1=argmin||x||1   s.t.  y=Ax;(3)
上述的描述都是在理想条件下，一般条件下，图像都是有噪声存在的，因此需要在y=Ax后面加一个误差项，即y = Ax+e。
及转化为求解下面的1范数问题：
x2=argmin||x||1 s.t.||Ax-y||2<=e;(4)
上面是一个凸优化问题，应用已有的理论就可以解决。
但是由于噪声等得影响，x的非零元素会散布于很多类间。为了通过x2分类，采用以下分类函数：
min r(y)=||y-A*di(x2)||2;(5)
下面介绍稀疏表示用来进行图像识别的基本步骤：
1.采集样本。即获得训练样本跟测试样本。
2.对训练样本跟测试样本同时进行降维处理。
3.设定误差上界，依(4)式求解x2。
4.根据(5)式进行分类，输出计算后的分类与识别率。

Complete Dictionary Recovery over the Sphere

摘要

  我们考虑一个问题，恢复一个完备（比如，平方的和可逆的）的数组A0，从和中，提供X0是充分的稀疏。这个恢复问题是字典学习的的核心理论，那就是找输入信号集合的一个稀疏表示，并且找到大量的应用在现在的信号处理和机器学习中。我们给出第一个有效的算法是，验证的恢复A0，当X0有O(n)个非零项每列，在适当的概率模型下对于X0.相反的，优先的结果基于有效的算法提供恢复担保，当X0只有个非零项每列。
我们的算法管理中心围绕着解决一个确定的非复杂优化问题，用一个球面的约束，因此是自然地概括性的在多种优化语言中。为了展示这个表面上的困难问题是易处理的，我们首先提供一个高维客观风景的几何特征，展示没有伪造的局部极小值的高可能性。这个特殊的几何结构允许我们去设计一个黎曼几何，相信地域算法在球体上，也许收敛于一个局部的更小用一个任意的初始值，尽管鞍点的存在。我们提出的几何方法，也可能解决其他问题，比如源于结构化信号的非凸恢复。
会议主要涉及到几个点：字典学习，非凸优化，球约束，信赖域方法，多重优化，函数坐标，二阶几何，倒数问题，结构化信号，非线性近似。
方法
  这个会议介绍了非凸优化启发法对于字典学习的帮助。
  字典恢复的设置（个人理解，可能有部分出入）：
  给定一个数据数组Y，Y=A0*X0  ，，（合理的稀疏）。根据这个公式恢复A0和X0。
定理1.1(非正式声明我们的结果)对任何θ∈(0,1/3),鉴于Y = A0X0 A0完备的字典和X0∼i,id。BG(θ),有一个多项式时间算法,恢复A0,X0概率(至少1−O(p−6))当p≥p* (1 /θ,n,κ(A0),1 /µ)固定多项式p *(·),κ(A0)是A0的条件数,µ参数可以被设置为一个固定的cn−5/4,积极数值常数c。
这个公式中，即使X0是已知的，仍然需要p>=n解决识别问题。在我们的特殊概率模型下，一个简单的优惠券收集机制意味着，需要去确保A0的所有高概率原子。去确保一个有效的算法存在可能需要更多。这个方法提出，当是多项式在中，用有效的算法恢复是可行的。
  参数θ控制稀疏X0水平。直观地说,重建的问题是对于小θ容易和对大θ困难。一个有效的算法有助于形成常数θ,即在X0,线性稀疏。时的情况相比A0是已知的,最多只有一个常数的稀疏水平差距可以处理。
  对于字典学习，我们的结果给第一个有效的算法，可证地恢复完备A0和X0，当X0每列有O（n）个非零项，在适当的概率模型下。

创新

1.凸公式

因为和是完备的，并且因此的行是稀疏的向量在已知的子空间。我们可以用这个结论去首先恢复的行，并且随后恢复，通过求解线性方程式。实际上，对于，的行是n个稀疏向量在行(Y)中。通过解决下面的公式，求出的行。


图2:为什么在Sn−1驯良的字典学习?假设目标字典A0是正交的。左:大样本目标函数EX0[f(q)]。唯一的局部最小值的列A0及其底片。中心:相同的功能,可视化为高度高于飞机⊥1(a1是A0的第一列)。正确的:在最优正曲率的函数展示一个小区域,一个区域的大梯度,最后一个区域的方向远离a1是一个负曲率方向。
2.高维函数
  正交几何。采取。因为，仅仅是的旋转版本，比如。因此，我们会集中看这个情况。在的2n个对称部分，集中围绕信号基础向量，我们开展工作围绕对称部分作为一个例子。
  我们再次用到上次的投影方法，这次在赤道平面，这次可以正式的重设参数映射：

W是新的变量在并且是单位块。
3.一个二阶流形算法：黎曼信赖域算法

      切线空间和指数映射定义在球体上。

总结

这是JohnWight 的最新研究成果，因为全是数学公式，也看的不是很明白，大体总结是求解尽量稀疏A0的过程，中间用到凸优化，低秩，高斯函数等。主要用三个方法去优化A0，介绍这三个优化方法，并在下面的文中推导这三个公式的可行性，让我认识到稀疏表示的优化是需要强大的数学功底的（岂敢望其项背），由于这三个方法的具体数学公式，没看的太明白只能大体介绍一下稀疏表示的基本原理，和文章我理解的主要公式，但并不是很全面，希望接下来的学习中，可以更加深入的了解这些内容。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航