您的位置：首页 > 其它

聚类基本数学模型

2009-04-11 16:23 169 查看

　　聚类方法是一类用途非常广泛的算法，聚类包含很多各式各样的算法。所有这些算法都有它的基本数学模型。本文就简单介绍一下聚类的基本数学模型。了解了基本数学模型就了解了聚类最本质的原理。无论是学习算法还是自己开发新的算法，学习基本数学模型都是很有帮助的。本文的目的一方面是介绍数学模型，另一方面也算是自己学习内容的一个记录吧。

　　假设X＝{x1,x2,…,xn}是待分析的对象全体，也可称为论域或样本集合。X中的每个对象（也可称为样本）

常用有限个参数值来刻画（这里的参数值也可称为样本的属性值），每个参数值用于刻画xi的某个特征（属性）。于是对象xi就伴随着一个向量P(xi)=(xi1,xi2,…,xim), 其中xij()是xi在j个特征上的值，P(xi)称为xi的特征向量或模式向量（也可理解为用于定义聚类中心的向量，不过这样的理解并不严谨，因为并非每种聚类方法都是以类似于KMEANS那样的中心点来定义簇的，所以在数据模型中以P(xi)来表示在意义上更加抽象）。聚类分析就是分析论域或样本集合X中的n个样本所对应的模式矢量间的空间距离及分散情况，按照各样本间的距离远近或相似程度把x1, x2,…, xn划分成k个不相交的模式子集X1, X2, …, Xk，并要求满足下列条件：