您的位置：首页 > 其它

[外文翻译] A Survey on Data Compression in Wireless Sensor Networks

2014-06-29 16:43 274 查看

原文：A Survey on Data Compression in Wireless Sensor Networks ---- from： Naoto Kimura and Shahram Latifi

译文：关于无线传感网络的数据压缩调查

原文和译文可以到我的资源下载，我的下载。

关于无线传感网络的数据压缩调查
摘要:无线传感网络(WSNs)的资源是受约束的：有限的能量支持，通信的带宽，处理的速度以及内存空间。最大限度的利用这些资源的一种可能的方式是将传输数据进行压缩。通常情况下，在无线媒体中处理数据消耗的电力比传输数据要少，所以，在传送数据之前对传感器节点进行数据压缩以减少总功耗是有效的。然而，现有的压缩算法并不适用于传感器节点,因为它们的资源是受限的。因此，本文介绍了一些被专门设计的用于无线传感网络的压缩算法：通过命令的编码，流水线网络压缩，低复杂性的视频压缩和分布式压缩。

1. 引言

由于快速发展的半导体制造技术，电子设备变得更小，更便宜，操作所需的能量一年比一年少。无线传感网络是得益于该技术进步的领域之一。近年来，大量关于无线传感网络的研究已经开始进行，并且人们已经意识到它无限的适用性。比如说，无线传感网络可以用于不同环境下的数据收集，就像环境监测、行为监测、监视、结构监测、设备诊断、灾害管理和应急响应。然而，无线传感网络的技术相对还不成熟，在它变得更实用之前仍然需要更多大量的研究和开发。

无线传感器网络的基本配置是在传感器领域部署大量的传感器节点。所有节点通过射频、红外线、或其他无线介质连接。数据的收集通过遍历无线网络中的所有节点实现。为了实现无线传感网络，点对点网络技术被广泛应用以便允许任何两个节点之间的直接通信。如果两个设备之间不能直接通信，那么在此之间的其他节点将会在源节点和目标节点之间发送数据包。这被称为多点跳跃传输路由。由于他们的点对点通信模式，不需要一个控制网络构成的中心节点（类似于一个蜂窝系统的基站）。因为无线传感网络没有了固定的基础设施，建造一个网络更加廉价。网络中节点在增加和移除更为容易。另一方面，由于节点可以随意地添加和删除，无线传感网络的网络拓扑可能会彻底改变。来自传感节点的数据通过汇点被收集。汇点可以通过网络或卫星与局域网外的世界连接。传感节点会在传感领域消失，所以传感器节点的位置不能预先确定。本文讨论的传感器将配备至少一个电源、传感装置、处理单元（使得数据可以在传感器单元中处理）和收发单元。
就像之前所说，希望每个传感节点的尺寸变小。为了达到这个要求，每个传感器组件的尺寸比如能量源，处理单元和储存单元的组件都必须要小。许多传感节点也会被部署到很难访问的位置。实现比如在部署的传感器节点上更换电池等维护操作是不实际的。由于以上原因，无线传感网络，或者更具体地说是每个传感节点是受资源约束的。受限于的电能支持，通信的带宽，处理的速度以及存储空间。因此，目前有许多致力于如何使有限传感资源达到最大化的研究已经进行。

传感网络的资源利用率研究之一是数据压缩。研究者们寻求压缩传感数据的最佳方式。通过这些做法，由于在不同节点上处理和传送数据可以减少能量的消耗从而扩展了他们在传感网络上的生存时间。通过减小数据的大小的方式，收发数据需要减少带宽。数据压缩式是一个利用资源有限的无线传感网络的有效方法。

本文的其余结构如下：在下一个章节，我会阐述无线介质中数据压缩和传送的能量消耗。一些专门设计的无线传感网络方案会在章节3表述。最后，章节4是总结。

2. 无线介质能量消耗的分析

在能量消耗方面，无线传感节点的操作可以分为3个部分：感知、处理和传输。在这3部分中，最消耗能量的任务是数据传输。每个传感器中大约80%的电能用于数据传输。所以如果我们可以通过压缩减少数据量，那么就可以减少传输的功耗。但从另一方面看，应用数据压缩会使处理需要更多能量来实现压缩算法。为了减少总功耗，传输和处理数据的总功耗必须减小。压缩字符串“a”到“b”

（a>b）所消耗的能量必须小于传输“a-b”字符串所消耗的能量。

在参考文献5中，呈现了一个关于在无线通信中通过数据压缩和数据传输的能量消耗的研究。在他们的实验中，康柏个人服务器（康柏iPAQ的研究版本）代替无线传感节点收集数据，所以他们的实验结果可能不能完全适用于无线传感网络。但是，这仍然在数据处理和传输的能量消耗方面给出了重要的见解。

第一个试验是收集执行一个简单的32位加法指令和传输一个位所消耗的电能数据。结果表明大约0.4微焦的能量用于发送单一的一个位的数据。其中0.86纳焦能量用于加法指令。无线传输介质中传输一位所耗能量相当于执行480次加法指令。结果表明，如果通过应用压缩操作从原始数据位字符串移除超过一位,它接受指令相当于480加法指令，，这将通过传感器节点减少所耗能量。

实际的数据压缩算法远比一系列的加法指令复杂，所以下一个实验显示通过应用各种现有的用于web页面和文本的无损数据压缩所消耗的总功。这个实验进行的测试压缩算法是bzip2 (BWT算法)，压缩 (LZE算法)，LZO (LZ77)，PPMd (PPM)和zlib(LZ77)。表1显示了移除一个位所需的指令数量。每个数据压缩算法的指令数比480要少得多，所以使用这些算法时，比简单传输数据消耗的总功要小。根据实验结果，对于大多数压缩算法，在传输数据前进行压缩可以减少总功。但是，在某些情况中也会增加能量的消耗。这是由于执行压缩时访问了内存。访问内存是能量消耗的重大因素。因此，实验结果指明在无线介质传输前压缩数据可以有效减少大量功耗，关键在于选择一个在压缩数据时尽量不需要访问内存的算法。

3. 数据压缩技术

在之前的章节研究中介绍了发送数据消耗的能量比处理数据多，在无线介质传输之前缩小数据量能够有效的减少总功的消耗。因此，采用数据压缩算法对于无线传感网络是有益的。

一个问题是大多数现有的数据压缩算法不适用于无线传感网络。其中一个原因是算法的大小。比如说，bzip2的大小是219KB ，LZO 是220KB。传感器节点的指令内存大小当前可用的只有128MB。另一个原因是处理器的速度。传感器节点的处理器速度只有4MHz。另一方面，如今计算机的处理速度大概是3GHz。所以必须位传感网络设计一个低复杂性并且数据量小的压缩算法。在这一节中，会介绍一些无线传感网络的数据压缩方案。

3.1 编码排序

在参考文献7中，介绍了作为数据汇集路由的数据压缩的编码。这个压缩方案如下。首先，数据从传感器节点感兴趣的地区通过，到一个汇点节点（设置如图1所示）。在数据汇集路由中，一些传感器节点像数据汇集节点一样工作。例如，节点A、B、D是数据汇点节点。通过与其他节点组合收集传感数据，聚合数据发送给它的父节点。在图3的节点D，通过节点E与收集数据节点D结合再收集数据。然后汇集数据传输到节点B。

该算法中，当数据与汇点节点结合时，一些数据被丢弃。为了包含汇集数据中丢弃数据的信息，利用了数据包的顺序。比如说，4个节点 (N1，N2，N3和

N4)发送数据到一个汇点节点(Na)。每一节点的数据值可以是0-5任何一个整数。如果我们把数据从N4丢弃通过其他3个节点的数据包从N4传输，就有3! = 6 种

可能的排序。因此，通过使用3个数据包的排列，N4的数据值可以被包含到汇点包中而没有完全包含N4的数据包。可能的组合排列和数据值如表2所示。

一般情况下，我们假设传感器节点的总数是n（每个节点有不同的节点ID），m是节点发送数据包至一个汇点节点的数量，k是可能范围的数据值，l是在汇点节点丢弃的传感器节点的数量。ID可能的组合数量可以表示为

。因为每个l节点可以搭载k值间的任何可能数据值，共有kl可能的数据值组合。当结合可能的ID和数据值，共有

种可能值。这个值的组合能表达为(m−l)!种排列。因此，下面的不等式是成立的。

（1）
从理论上讲，当n =27，k = 24，m = 100，大约44%的数据包可以应用编码排序删除汇点节点。因为这种方法具有良好的压缩比和简单的算法，它可用于无线传感网络。困难之一是利用这个方案，由于没有有效的算法映射排列数据值，所以需要一个映射表。随着传感器汇点节点数量的增加，表的大小呈指数增长。

3.2 流水线网内压缩

文献6中讨论了流水线网内压缩。基本的想法是用高数据传输延迟降低传输能源消耗。在一个汇点节点存储缓冲的收集传感器数据区需要一些持续时间。在那段时间，数据包被组合到一个包，和减少的数据包一起被删除，以最大限度减少数据传输。

比如说，每个数据包有一下形式：<measured value, node ID, timestamp>。然后，压缩数据封包有以下形式：<shared prefix, suffix list, node IDlist, timestamp list>。“共享前缀”是最重要的部分，是所有测量值在联合数据包的共同点。共享前缀的长度可以根据用户对数据相似性的认识改变。如果预计的测量值接近对方，前缀值的长度可以设置相对较长。“后缀列表”是测量值列表不包括共享前缀的部分。“节点ID列表”是一组节点标识符，“时间戳列表”是列表的时间戳。压缩方案如图4所示。在此图中，三个节点发送数据包到压缩节点。在压缩节点，三个数据包被压缩成一个包。在本例中，共享前缀的长度被设置为3。在这个例子中，所有位的数量从37减少到33。

这个简单的压缩方案的一个优点是，共享前缀系统可以用于节点ID和时间戳。通过这样的做法，可以实现更多的数据压缩。数据压缩的效率取决于共享前缀的长度。如果我们可以设置一个长的共享前缀和一个有共性的测量值，压缩比就会增加。然而，没有相似的测量传感值，即使我们可以设置一个长的共享前缀，网络压缩流水线的效率也会降低。此外，如果我们结合大量的数据包，就会大于数据缓冲区需要的临时存储包。因为一个传感器节点只有一个有限大小的内存空间，将没有足够的缓冲空间可用。

3.3 低复杂性视频压缩

文献8介绍的低复杂性视频压缩。因为当前的视频编码技术主要设计利用运动估计和补偿，它将需要一个高计算功率，那么传感器节点通常不配备。因此，该方法是基于块的变化检测算法和JPEG数据压缩。图3展示了一个块的图像数

据处理流。该算法是专门为无线视频监控系统设计的。在这个方法中，每个视频帧被分成小块，每个块包含8×8(64)像素。为了减少计算复杂度，只有一部分的块（所有空白块在这种情况下）在帧中被考虑。此外，在每一块像素子集中（号码分配像素）检查他们的变化，如图7所示。分配给像素的数量表明像素的重要性（1 =最重要和3 =最不重要）。

该算法如下：第一步，一块“1”指定像素与参考帧的像素。如果两个像素的差异(Di)大于一个阈值(M)，初值为零计数器(P)增加了1。两个像素的最大区别是存储U，如果P比一个敏感性参数(S)大，就由一个用户设置，可以用一个1到3的整数，块标记为一个活跃的块，扫描程序移动到下一个块。如果在检查所有“1”的像素后P ≤ S，平均差异(A)可以被计算。如果A<N并且U<M，N是另外一个阈值且N<M，处理下一个块。否则，开始检查“2”的算法指定像素在同一块。

“2”和“3”在同一块指定像素，过程与执行“1”分配像素相同。不同的是，在检查所有像素后，如果A>N且U>M，块被标记为一个活跃的块，程序移动到下一个块为“2”指定像素。为“3”分配像素在检查所有像素后，如果(A>N 且 U>M)或者(A<N,U>M, 且P>S)，块标记为活跃块。

在检查一个帧内的一组空白块之后，非扫描块(在图7中的黑色块)被检查。如果一个非扫描块至少与两个活动块相邻，非扫描块被标记为活动。

最后，所有的标记块被编码成JPEG格式并在无线传感器网络中传输。同时，活动块被传输给参考帧缓冲区用于更新数据参考帧。

实验结果表明，通过此算法处理的图像质量与通过算法mpeg-2处理的非常类似尽管这种算法实现了一定的节能效果。

3.4 分布式压缩

通过[9][4]的介绍，分布式压缩方案的基本思想是使用边信息编码源信息。例如，如图4中存在两个数据源(X,Y)。他们是相关的和离散的字母独立同分布的。因为在传感器网络中，传感器节点将密集分布在传感器范围内，这种相关性条件可以很容易得到满足。然后，X可以以条件熵的理论利率进行压缩，H(X | Y)，没有编码器1访问Y[3]。条件熵可以表示为

（8）

一般的分布式压缩方案是首先编码叠合组，其源数据X的矢量。在一个相同的数据集中的任何两个矢量的距离必须足够大。一个索引值被分配给每个数据集。当数据传输到一个解码器，源X只发送一个这个矢量所属的数据集的索引值。源Y发送一个矢量作为边信息。译码器查找数据集，这个数据集具与收到的X具有相同的索引。然后，译码器选择一个矢量，在这个集合中，它具有一个与由Y发送的矢量最接近的值。

分布式压缩的一个简单例子如下。有两个(X和Y)3位的数据集。X和Y之间的汉明距离不超过一位。如果两个编码器和译码器都知道Y，X可以被压缩到2位。然而，如果Y只对解码器已知，X的压缩率将会是多少呢？根据分布式压缩方案，因为译码器知道Y和X距离Y只有一个汉明距离，区分X =111还是X = 000的效果是不佳的。相同的原因，X = 001和110，X = 010和101，X = 011和110不需要相互区别。这些两个X值的组被分为4 数据集、分配4不同的二进制索引号：

数据集1 = (000, 111) : 00

数据集 2 = (001, 110) : 01

数据集 3 = (010, 101) : 10

数据集 4 = (011, 100) : 11

如果X = 010，Y = 110，译码器将收到的Y = 110作为来自Y的边信息，X = 10作为一个来自X局部信息。然后在解码器中，数据集2 中的X = 010被选中因为110和110距离2个哈明距离。无论X是否知道Y，X仍然可以将3位信息压缩到2位。

通过上面例子，分布式压缩方案不仅可以应用于离散的数据源，也可以应用于连续的数据源。同时，它可以用于无损压缩和有损压缩方案。例如， 4个数据集可以由一个8级量化器形成。值得注意的是：每个数据集中的两个矢量是被分组的，这样他们彼此可以有最大可能的距离。

4. 结论

在当前社会中，人们正在讨论WSNs的广泛的应用领域。在未来随着技术的进步WSNs的应用领域将比现在更为广泛。对人们来说，他们将比现在更为有用。然而，在那些实现之前，在传感器网络的实际使用中仍然存在许多困难需要克服。困难之一是无线节点的资源有限。本文中，提出了五个不同类型的数据压缩方案---通过命令编码、流水线网内压缩、JPEG200、低压缩低复杂度的视频压缩和分布式压缩。尽管这些压缩方案仍处于开发阶段，实验结果表明，其压缩率和节电性能相当惊人。他们是一个用以减少无线传感器节点资源约束的可能的方法。

参考文献

[1] I. F. Akyildiz, W. Su, Y. Sankarasubramaniam, and E. Cayirci, “Asurvey on sensor networks,”

IEEE Communications Magazine, Volume: 40 Issue: 8, pp. 102-114,August 2002

[2] D. Culler, D. Estrin, and M. Srivastava, “Guest Editors’Introduction: Overview of Sensor Network,” Computer, Volume: 37 Issue: 8, pp.41-49, August 2004

[3] D. Slepian and J. K. Wolf, “Noiseless Coding of CorrelatedInformation Sources,” IEEE Trans. on Information Theory, Volume: IT-19, pp.471-480, July 1973.

[4] J. Kusuma, L. Doherty, and K. Ramchandran, “DistributedCompression for Sensor Networks,” In Proceedings of 2001 InternationalConference on Image Processing, October 2001.

[5] Kenneth Barr and Krste Asanovic, “Energy Aware Lossless DataCompression,” In First International Conference on Mobile Systems,Applications, and Services, May 2003.

[6] T. Arici, B. Gedik, Y. Altunbasak, and L. Liu, “PINCO: aPipelined In-Network Compression Scheme for Data Collection in Wireless SensorNetworks,” In Proceedings of 12th International Conference on ComputerCommunications and Networks, October 2003.

[7] D. Petrovic, R. C. Shah, K. Ramchandran, and J. Rabaey, “DataFunneling: Routing with Aggregation and Compression for Wireless SensorNetworks,” In Proceedings of First IEEE International Workshop on SensorNetwork Protocols and Applications, May 2003.

[8] E. Magli, M. Mancin, and L Merello, “Low-Complexity VideoCompression for Wireless Sensor Networks,” In Proceedings of 2003 InternationalConference on Multimedia and Expo, July 2003.

[9] S. S. Pradhan, J. Kusuma, and K Ramchandran, “DistributedCompression in a Dense Microsensor Network,” IEEE Signal Processing Magazine,Volume: 19, Issue: 2, pp. 51-60,

March 2002.

[10] MICA Wireless Measurement System http://www.xbow.com/Products/Product_pdf_files/Wireless_pdf/MICA.pdf

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航