LZW压缩算法——简明原理与实现
2016-01-14 15:20
393 查看
http://blog.csdn.net/abcjennifer/article/details/7995426
LZW和哈夫曼编码一样,是无损压缩中的一种。该算法通过建立字典,实现字符重用与编码,适用于source中重复率很高的文本压缩。本文首先讲下LZW的编解码原理,然后给出LZW的实现code。
*********************原理*********************
编码:
编码0-255用来存储Ascii码为[0,255]的字符,放在字典里。
编码从256开始,将出现过的字符计入字典
核心思想:利用字符的可重用性,每当往结果输出一个编码,就将一个新的string存入dictionary
算法流程:
举例:
解码:
编码的逆过程,若编码是string到int的映射,我们可以将解码过程描述为int到string的映射。
LZW算法的解码无需在编码过程中存储字典(这样太浪费空间了)
解码初始化依旧用256个Ascii码,后面每读入一个编码(int),检查其在dictionary中的映射,并不断将新的映射加入字典
算法流程:
解码的例子建议读者用下面的代码直接调试吧~
*********************实现*********************
我用C++实现的,Compress和Decompress两个函数分别实现编解码
[cpp] view
plaincopy
/************************************************************************/
/* File Name: LZW.cpp
* @Function: Lossless Compression
@Author: Sophia Zhang
@Create Time: 2012-9-19 10:00
@Last Modify: 2012-9-19 11:10
*/
/************************************************************************/
#include"iostream"
#include "map"
#include "string"
#include "iterator"
#include "vector"
using namespace std;
/************************************************************************/
/* Compress Module
* input:
str - the string need to be compressed
result - compress result
*/
/************************************************************************/
template<typename TypeIterator>
TypeIterator Compress(string str, TypeIterator result)
{
//Build the dictionary
map<string,int>dictionary;
int Dictsize=256;
for(int i=0;i<Dictsize;i++)
dictionary[string(1,i)]=i;
char z;
string S;
for(string::const_iterator it = str.begin(); it!=str.end(); it++)
{
z = *it;
if(dictionary.count(S+z))//can find S
S+=z;
else//S is not in dictionary D
{
*result++ = dictionary[S]; //output pointer (S,D)
dictionary[S+z] = Dictsize++; //add to dictionary
S = z;
}
}
if(!S.empty())
*result++ = dictionary[S];
return result;
}
/************************************************************************/
/* Decompress Module
* input:
TypeIterator result - compression result, to be decompressed
*/
/************************************************************************/
template<typename TypeIterator>
string Decompress(TypeIterator result)
{
map<int,string>inv_dictionary;
int Dictsize=256;
for(int i=0;i<Dictsize;i++)
inv_dictionary[i] = string(1,i);
char z;
string S;
string entry;
string res;
Dictsize--;//because the first "Dictsize++" make no sense, it has only one char in [0,255]
for(TypeIterator::iterator it = result.begin(); it!=result.end(); it++)
{
int k = *it;
if(inv_dictionary.count(k))
entry = inv_dictionary[k];
else if(k==Dictsize)
entry = S+ S[0];
else
throw "Bad compression code";
res += entry;
inv_dictionary[Dictsize++] = S + entry[0];
S = entry;
}
return res;
}
int main()
{
typedef vector<int> TypeIterator;
TypeIterator compress_res;
string S = "the/rain/in/Spain/falls/mainly/on/the/plain";
Compress(S,std::back_inserter(compress_res));
// copy(compress_res.begin(),compress_res.end(),std::ostream_iterator<int>(std::cout,","));
// std::cout<<std::endl;
//output the compressed result
for( TypeIterator::iterator it= compress_res.begin(); it!=compress_res.end(); it++)
cout<<(*it)<<endl;
//decompress the compressed result
string decompress = Decompress(compress_res);
cout<<decompress<<endl;
}
result:
Reference:
1. http://www.stringology.org/DataCompression/lzw-e/index_en.html
2. http://www.dspguide.com/ch27/5.htm
3. http://marknelson.us/1989/10/01/lzw-data-compression/
4. http://www.ccs.neu.edu/home/jnl22/oldsite/cshonor/jeff.html
LZW和哈夫曼编码一样,是无损压缩中的一种。该算法通过建立字典,实现字符重用与编码,适用于source中重复率很高的文本压缩。本文首先讲下LZW的编解码原理,然后给出LZW的实现code。
*********************原理*********************
编码:
编码0-255用来存储Ascii码为[0,255]的字符,放在字典里。
编码从256开始,将出现过的字符计入字典
核心思想:利用字符的可重用性,每当往结果输出一个编码,就将一个新的string存入dictionary
算法流程:
举例:
解码:
编码的逆过程,若编码是string到int的映射,我们可以将解码过程描述为int到string的映射。
LZW算法的解码无需在编码过程中存储字典(这样太浪费空间了)
解码初始化依旧用256个Ascii码,后面每读入一个编码(int),检查其在dictionary中的映射,并不断将新的映射加入字典
算法流程:
解码的例子建议读者用下面的代码直接调试吧~
*********************实现*********************
我用C++实现的,Compress和Decompress两个函数分别实现编解码
[cpp] view
plaincopy
/************************************************************************/
/* File Name: LZW.cpp
* @Function: Lossless Compression
@Author: Sophia Zhang
@Create Time: 2012-9-19 10:00
@Last Modify: 2012-9-19 11:10
*/
/************************************************************************/
#include"iostream"
#include "map"
#include "string"
#include "iterator"
#include "vector"
using namespace std;
/************************************************************************/
/* Compress Module
* input:
str - the string need to be compressed
result - compress result
*/
/************************************************************************/
template<typename TypeIterator>
TypeIterator Compress(string str, TypeIterator result)
{
//Build the dictionary
map<string,int>dictionary;
int Dictsize=256;
for(int i=0;i<Dictsize;i++)
dictionary[string(1,i)]=i;
char z;
string S;
for(string::const_iterator it = str.begin(); it!=str.end(); it++)
{
z = *it;
if(dictionary.count(S+z))//can find S
S+=z;
else//S is not in dictionary D
{
*result++ = dictionary[S]; //output pointer (S,D)
dictionary[S+z] = Dictsize++; //add to dictionary
S = z;
}
}
if(!S.empty())
*result++ = dictionary[S];
return result;
}
/************************************************************************/
/* Decompress Module
* input:
TypeIterator result - compression result, to be decompressed
*/
/************************************************************************/
template<typename TypeIterator>
string Decompress(TypeIterator result)
{
map<int,string>inv_dictionary;
int Dictsize=256;
for(int i=0;i<Dictsize;i++)
inv_dictionary[i] = string(1,i);
char z;
string S;
string entry;
string res;
Dictsize--;//because the first "Dictsize++" make no sense, it has only one char in [0,255]
for(TypeIterator::iterator it = result.begin(); it!=result.end(); it++)
{
int k = *it;
if(inv_dictionary.count(k))
entry = inv_dictionary[k];
else if(k==Dictsize)
entry = S+ S[0];
else
throw "Bad compression code";
res += entry;
inv_dictionary[Dictsize++] = S + entry[0];
S = entry;
}
return res;
}
int main()
{
typedef vector<int> TypeIterator;
TypeIterator compress_res;
string S = "the/rain/in/Spain/falls/mainly/on/the/plain";
Compress(S,std::back_inserter(compress_res));
// copy(compress_res.begin(),compress_res.end(),std::ostream_iterator<int>(std::cout,","));
// std::cout<<std::endl;
//output the compressed result
for( TypeIterator::iterator it= compress_res.begin(); it!=compress_res.end(); it++)
cout<<(*it)<<endl;
//decompress the compressed result
string decompress = Decompress(compress_res);
cout<<decompress<<endl;
}
result:
Reference:
1. http://www.stringology.org/DataCompression/lzw-e/index_en.html
2. http://www.dspguide.com/ch27/5.htm
3. http://marknelson.us/1989/10/01/lzw-data-compression/
4. http://www.ccs.neu.edu/home/jnl22/oldsite/cshonor/jeff.html
相关文章推荐
- angularjs 测试
- mongodb 常用命令 日期, 分组
- html、css常见问题及解决方案(1)
- uva12657 Boxes in a Line
- Latex 公式居中
- mfc 使用jpg图片做对话框背景
- c中自定义函数通过sizeof来输出数组的长度为何不正确?【原创】
- Latex 公式居中
- DataTables 的 实例 《一》
- FAQ14351]L版本12小时制状态栏时间不显示AM/PM
- Android开发笔记(四十八)Thread类实现多线程
- JSLint for Eclipse
- 正则表达式
- iOS网络-NSURLConnection简单介绍
- 关于NSNotification的使用(重点掌握)
- RAC 集群更换IP
- 配置远程控制
- C#高级编程 反射 代码示例
- thinkCMF+iis6实现伪静态, 强烈支持我大TP框架!希望更多人能喜欢它!
- 安装HTTP压力性能测试工具ABSender