您的位置:首页 > 其它

D-wave量子退火(quantum annealing)与机器学习

2015-11-15 20:33 134 查看
l  简述

Ising model作为一个编程模型,其能量函数为我们熟知的形式







通过量子绝热过程得到问题解决方法

初始Hamiltonian





问题Hamiltonian



D-wave解决一般问题(主要是优化问题【1】)的方案是找到问题与Ising model的映射,由于物理上的制约,D-wave的量子计算机不能连接任意两个qubits,因此就算它物理上能实现量子相干也不算是通用量子计算机。D-wave非常擅长解决二次非约束二进制优化问题(Quadratic Unconstrained Binary Optimization,QUBO)。一旦我们找到这种映射,那么我们就不再需要再关心如何设计方法得到最优解,因为量子绝热过程会自动地到达基态,也就是最优解,理论上可以保证全局最优,因为有量子叠加态的帮助,不过物理上很难实现大规模粒子的相干性和纠缠的保存。D-wave并也并没有很好地实现它。

实际实现所面临的问题

1. 精度限制与控制误差

2. 能量和温度范围限制

3. 稀疏连接限制

4. Qubits数量限制

l  解决方案

所要解决问题到Ising model的映射是D-wave编程思想的核心,这与我们做优化问题的方法类似,首先得构造好目标函数,只不过D-wave由于硬件的特殊性,目标函数只能是ising model的形式。同时,由于硬件不支持任意两个qubits连接,即连接的稀疏性,我们得采用embedding【2】等方法解决这个问题。

奇美拉图(Chimera graph),K8(K4,4)是D-wave的一个基本单元,称作chain。可以画成下列两种形式,注意到,同一种颜色之间是不互连的,只有不同颜色间才全部连通。当把这种结构扩展后,连接方式依然有这种类似的稀疏特性,这是硬件的局限性引起的。



K4,4 (8 qubits,16 couplers)
为了解决一些带约束的问题,我们可以用下面方式构造惩罚项来到达约束条件满足。

约束项惩罚









a为辅助变量(ancillary variables),用于辅助形成约束条件

能隙(energy gap),空间的量子态与非可行空间的量子态存在能隙



我们希望能隙尽可能大,以减小控制误差和有限温度带来的影响,那么惩罚应该满足如下条件:





D-Wave 2X(512qubits)的编程抽象拓扑连接图(密集恐惧慎看!






    
l  具体编程例子

1. 寄偶校验(Parity check)【3】



可行空间


下图显示了两种构造惩罚的方法,很明显右图更好,因为它能使gap更大。要注意的是,这些图还不能直接使用,必须转化为K8形式的连接方式才可以实施硬件操作,同时权重在[-1,1]的范围内,为了方便,这里不做归一。



2. 地图着色问题【4】

这是个一个更为有趣的例子。用四种颜色为加拿大(D-wave是加拿大的公司,他们应该庆幸是加拿大,当时的D-wave One 128qubits可完成不了中国这么多省的着色)地图着色,每个州一种颜色,相邻的州颜色不同,这个问题一定有解(四色问题保证)。



惩罚如下面形式,这里qi取值{0,1},与上面的si取{-1,1}不一样并不会使这些方法失效,只不过调整权重时有所不同。





当a1=a2=1,b12=-2时,可行域F={00,11},当a1=a2=-1,b=-2时,可行域F={01,10},这与铁磁性和反铁磁性类似。

这个很有用,当我们希望两个qubits保持相同或相反时可以使用这种方法。

构造颜色编码,2qubits很难实现,现在考虑4qubits,即{1000 ,0100 ,0010 ,0001}={red ,green ,blue ,yellow}

理想是美好的,现实却很残酷,实际上我们需要8qubits来编码一个区域(也就是一种颜色,每个区域对应一种颜色)。

第一个chain(K8)上有1,2,3,4个不同的qubit,看到1-1,2-2,3-3,4-4之间用权重为-1来连接,实际上是上面(a1=a2=1,b12=-2)的应用,目的是保持它们有相同的态。

1-2,1-3......之间的连接权重为1,实际上是(a1=a2=-1,b12=2)的应用,目的是使接受域F为{1000,0100,0010,0001}

Chain间用权重为1连接,实际上是(a1=a2=0,b12=1)的应用,使接受域F为{00,01,10},即排斥了相邻区域颜色相同,例如(如果1与5同为1,表明区域之间颜色相同,这是不允许的)。

点权可以抵消而不必赋权值。很容易验证,下图能产生能隙为1的惩罚函数。



最后如下图的方式,摆放各个chain,同名的区域,通过上述方法复制多一个,不过同名区域所代表的chain不能用排斥的方法连接。



3. 量子受限玻尔兹曼机(QRBM)【5】【6】

用D-wave做波尔兹曼机的训练是十分直观的,我们知道在训练玻尔兹曼机的过程中model部分的估计是十分重要的,然而实际的训练过程中不能保证其被很好地估计。其结果导致权重更新“错误“,不能更好地提高准确度。QRBM可以代替MCMC理论上获得model部分的更好估计。



QRBM采样估计,通过多次实施观测获得平均值做采样估计。



除了用量子退火的方法,用量子门电路的方法【7】也可以实现,不过量子运算部分依然当做一种更好的采样方法。

 
l  参考文献

【1】    Discrete optimization using quantum annealing on sparse Ising models

【2】    Embedding Logical Qubits into the D-Wave Hardware Graph

【3】    Mapping discrete optimization problems to sparse Ising models

【4】    Programming with D-Wave: Map Coloring Problem

【5】    Application of Quantum Annealing to Training of Deep Neural Networks

【6】    Toward the Implementation of a Quantum RBM

【7】    Quantum Inspired Training for Boltzmann Machines

 

 

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息