Huffman coding length
2016-08-23 09:25
92 查看
数据结构实验之二叉树六:哈夫曼编码
Time Limit: 1000ms Memory limit: 65536K 有疑问?点这里^_^
题目描述
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
输入
输入数据有多组,每组数据一行,表示要编码的字符串。
输出
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
示例输入
AAAAABCD
THE_CAT_IN_THE_HAT
示例输出
64 13 4.9
144 51 2.8
/*
本题思想与合并果子神似.字母种类------->果子种类, 每种字母的出现的次数------>移动每种果子所花费力气,用Huffman编码字符串的长度----->将所有果子合并在一起的最小力气
所以Huffman编码只是一种思想.1每次抽取2个最小的合并,删除这两个值,2并将两个最小值的和加入到原来的集合.重复1,2直至集合只有一个元素.
*/
# include <stdio.h>
# include <stdlib.h>
# include <string.h>
typedef struct node
{
int data;
struct node*next;
} Node;
void Add(Node*head,int key);
int get_huffman_code_length(Node*head,int kind);
int main()
{
int i;
int la;//ASCII code length
int lh;//Huffman code length
int kind;
char str[10000];
int frequency[128];
Node*head;
head = (Node*)malloc(sizeof(Node));
while((scanf("%s",str))!=EOF)
{
head->next = NULL;
kind = 0;//字母种类
la = strlen(str) * 8;
memset(frequency,0,sizeof(frequency));
for(i=0;str[i]!='\0';i++) //统计每种出现字符的个数
{
frequency[ str[i] ]++;
}
for(i=0;i<128;i++)
{
if(frequency[i])
{
Add(head,frequency[i]);
kind++;
}
}
lh = get_huffman_code_length(head,kind);
printf("%d %d %.1f\n",la,lh,(float)la/lh);
}
return 0;
}
void Add(Node*head,int key)
{
Node*p,*q,*r;
p = (Node*)malloc(sizeof(Node));
p->data = key;
p->next = NULL;
q = head;
r = head->next;
while( r && r->data < key )//从小到大建链表
{
q = r;
r = r->next;
}
q->next = p;
p->next = r;
}
int get_huffman_code_length(Node*head,int kind)
{
int sumlength = 0;//记录用huffman 编码的字符串长度
Node*p,*q,*r;
int i=0;
int sum;
for(i=1;i<kind;i++) // kind - 1 次合并
{
p = head->next;
q = p->next;
sum = p->data + q->data;//两个最小节点值的和
sumlength = sumlength + sum;
//删除两个最小节点
head->next = q->next;
free(p);
free(q);
//将两个最小节点值的和加入链表中
Add(head,sum);
}
//释放头结点之后的节点,此时只有一个
p = head->next;
free(p);
return sumlength;
}
Time Limit: 1000ms Memory limit: 65536K 有疑问?点这里^_^
题目描述
字符的编码方式有多种,除了大家熟悉的ASCII编码,哈夫曼编码(Huffman Coding)也是一种编码方式,它是可变字长编码。该方法完全依据字符出现概率来构造出平均长度最短的编码,称之为最优编码。哈夫曼编码常被用于数据文件压缩中,其压缩率通常在20%~90%之间。你的任务是对从键盘输入的一个字符串求出它的ASCII编码长度和哈夫曼编码长度的比值。
输入
输入数据有多组,每组数据一行,表示要编码的字符串。
输出
对应字符的ASCII编码长度la,huffman编码长度lh和la/lh的值(保留一位小数),数据之间以空格间隔。
示例输入
AAAAABCD
THE_CAT_IN_THE_HAT
示例输出
64 13 4.9
144 51 2.8
/*
本题思想与合并果子神似.字母种类------->果子种类, 每种字母的出现的次数------>移动每种果子所花费力气,用Huffman编码字符串的长度----->将所有果子合并在一起的最小力气
所以Huffman编码只是一种思想.1每次抽取2个最小的合并,删除这两个值,2并将两个最小值的和加入到原来的集合.重复1,2直至集合只有一个元素.
*/
# include <stdio.h>
# include <stdlib.h>
# include <string.h>
typedef struct node
{
int data;
struct node*next;
} Node;
void Add(Node*head,int key);
int get_huffman_code_length(Node*head,int kind);
int main()
{
int i;
int la;//ASCII code length
int lh;//Huffman code length
int kind;
char str[10000];
int frequency[128];
Node*head;
head = (Node*)malloc(sizeof(Node));
while((scanf("%s",str))!=EOF)
{
head->next = NULL;
kind = 0;//字母种类
la = strlen(str) * 8;
memset(frequency,0,sizeof(frequency));
for(i=0;str[i]!='\0';i++) //统计每种出现字符的个数
{
frequency[ str[i] ]++;
}
for(i=0;i<128;i++)
{
if(frequency[i])
{
Add(head,frequency[i]);
kind++;
}
}
lh = get_huffman_code_length(head,kind);
printf("%d %d %.1f\n",la,lh,(float)la/lh);
}
return 0;
}
void Add(Node*head,int key)
{
Node*p,*q,*r;
p = (Node*)malloc(sizeof(Node));
p->data = key;
p->next = NULL;
q = head;
r = head->next;
while( r && r->data < key )//从小到大建链表
{
q = r;
r = r->next;
}
q->next = p;
p->next = r;
}
int get_huffman_code_length(Node*head,int kind)
{
int sumlength = 0;//记录用huffman 编码的字符串长度
Node*p,*q,*r;
int i=0;
int sum;
for(i=1;i<kind;i++) // kind - 1 次合并
{
p = head->next;
q = p->next;
sum = p->data + q->data;//两个最小节点值的和
sumlength = sumlength + sum;
//删除两个最小节点
head->next = q->next;
free(p);
free(q);
//将两个最小节点值的和加入链表中
Add(head,sum);
}
//释放头结点之后的节点,此时只有一个
p = head->next;
free(p);
return sumlength;
}
相关文章推荐
- RPC failed; result=22, HTTP code = 411
- gosyd/go1.6.slide at master · davecheney/gosyd · GitHub
- Windows Server 2008 Code "Longhorn" Beta 3 提供下载
- dedecms v5.1 WriteBookText() code injection vul注入漏洞
- 在C#中生成与PHP一样的MD5 Hash Code的方法
- PHP通过微信跳转的Code参数获取用户的openid(关键代码)
- Live Write 的代码高亮插件 Paste Code
- ERROR CODE: 1175 YOU ARE USING SAFE UPDATE MODE AN
- IIS7.5 Error Code 0x8007007e HTTP 错误 500.19的解决方法
- Microsoft Windows Server Code Name"Longhorn"Beta 3 正式发布! 下载
- Microsfot .NET Framework4.0框架 安装失败的解决方法
- Windows 下Spark 快速搭建Spark源码阅读环境
- Huffman 编码压缩算法
- Leanote集成Ace代码编辑器, 程序员的最爱
- Python的Huffman编码的实现
- 好代码是廉价的代码
- Optimizing Java Code(Pro Android Apps Performance Optimization)
- data,bdata,idata,pdata,xdata,code存储类型与存储区bit
- Writing Efficient Android Code(转)