您的位置：首页 > 理论基础 > 数据结构算法

数据结构和设计模式01（数据结构的基础）

2015-07-19 12:35 495 查看

第十三章数据结构的基础
本章包含：数据结构、字符串的使用、栈、堆、排序等

1.链表
链表的创建、逆置、插入、删除等操作是重点。
创建单链表步骤：创建节点的数据结构——创建空的列表——利用（Node*）malloc（sizeof(Node)）函数分配节点空间——新节点的指针赋值为NULL——插入。如下：

<span style="font-family:SimSun;font-size:10px;">struct node //①定义链表数据结构
{
int num;
struct node *next;
};
main()
{
struct node *creat();
void print();
struct node *head;
head = NULL;    //②建一个空表
head = creat(head);/*创建单链表*/
print(head);/*打印单链表*/
}
/******************************************/
struct node* creat(struct node *head)/*返回的是与节点相同类型的指针*/
{
struct node*p1, *p2;
//③利用malloc ( )函数向系统申请分配一个节点
p1 = p2 = (struct node*)malloc(sizeof(struct node));/*新节点*/
printf("p1= %d\n", p1);
scanf("%d", &p1->num);/*输入节点的值*/
p1->next = NULL;/*将新节点的指针置为空*/
while (p1->num > 0)/*输入节点的数值大于0*/
{
//④将新节点的指针成员赋值为空。若是空表，将新节点连接到表头；若是非空表，将新
//节点接到表尾;
if (head == NULL)
head = p1;/*空表，接入表头*/
else
p2->next = p1;/*非空表，接到表尾*/
p2 = p1;
p1 = (struct node*)malloc(sizeof(struct node));/*下一个新节点*/
printf("p2= %d\n", p2);
scanf("%d", &p1->num);/*输入节点的值*/
//⑤判断一下是否有后续节点要接入链表，若有转到3 )，否则结束;
}
printf("p2->next=%d\n", p2->next);
return head;/*返回链表的头指针*/
}
/*******************************************/
void print(struct node*head)/*出以head为头的链表各节点的值*/
{
struct node *temp;
temp = head;/*取得链表的头指针*/
while (temp != NULL)/*只要是非空表*/
{
printf("%6d", temp->num);/*输出链表节点的值*/
temp = temp->next;/*跟踪链表增长*/
}
}</span>

插入、删除的操作非常简单，就是分配空间（malloc）、释放空间（free）以及指针指向的问题，此处不再举例了。

判断单链表是否有环以及环的入口问题：
判断是否有环：设置两个指针(fast, slow)，初始值都指向头，slow每次前进一步，fast每次前进二步，如果链表存在环，则fast必定先进入环，而slow后进入环，两个指针必定相遇。(当然，fast先行头到尾部为NULL，则为无环链表)。

<span style="font-family:SimSun;font-size:10px;">bool isExitsLoop(list *head)
{
list *slow = head, *fast = head;
while (fast && fast->next)
{
slow = slow->next;
fast = fast->next->next;
if (slow == fast) break;
}
return !(fast == NULL || fast->next == NULL);
}</span>

此问题可扩展至：求循环链表任一节点“对面的”（最远端）的节点，算法同上，当fast到达head（此处head为任一节点）或head->next时，slow指示的就是最远端的节点。
确定有环后，寻找环的入口，算法如下：

当fast若与slow相遇时，slow肯定没有走遍历完链表，而fast已经在环内循环了n圈(1<=n)。假设slow走了s步，则fast走了2s步（fast步数还等于s 加上在环上多转的n圈），设环长为r，则：

2s = s + nr 则s= nr

设整个链表长L，入口环与相遇点距离为x，起点到环入口点的距离为a。

a + x = nr

a + x = (n – 1)r +r = (n-1)r + L - a

a = (n-1)r + (L – a – x)

(L – a – x)为相遇点到环入口点的距离，由此可知，从链表头到环入口点等于(n-1)循环内环+相遇点到环入口点，于是我们从链表头、与相遇点分别设一个指针，每次各走一步，两个指针必定相遇，且相遇第一点为环入口点。

<span style="font-family:SimSun;font-size:10px;">list* FindLoopNode(list* head)
{
list *slow = head, *fast = head;

while (fast && fast->next)
{
slow = slow->next;
fast = fast->next->next;
if (slow == fast) break;
}

if (fast == NULL || fast->next == NULL)
return NULL;

slow = head;
while (slow != fast)
{
slow = slow->next;
fast = fast->next;
}

return slow;
}</span>

此问题可扩展至：判断两个单链表是否相交，如果相交，给出相交的第一个点（两个链表都不存在环）。

根据问题描述，两个单链表自相交点起，将合并为一个单链表，这是理解算法的关键。

算法描述：

将其中一个链表首尾相连，检测另外一个链表是否存在环，如果存在，则两个链表相交，而检测出来的依赖环入口即为相交的第一个点

双链表：
基本流程和单链表一样（吧单链表搞懂了，双链表非常简单），只是节点多了一个父指针，节点的数据结构如下：

<span style="font-family:SimSun;font-size:10px;">typedef struct Node
{
int data;
struct Node* prev;
struct Node* next;
}Node;</span>

2.队列
遵循先进先出，从尾部插入节点，从头部pop节点，队列只有头部指针和尾部指针，中间的节点指针都隐藏，如下：

<span style="font-family:SimSun;font-size:10px;">typedef struct Node
{
int data;
struct Node *next;
}node;
typedef struct Queue    //notice :队列的数据结构只是包括两个节点指针（头和尾）；
{
node* first;
node* back;
}queue;</span>

插入删除操作很简单：
插入：用（node*）malloc（sizeof(node)）分配内存，然后将节点添加到Queue的尾部
删除：pop队列的first节点，指针指向下一个节点，然后free空间；

3.栈
后进先出，插入和删除节点都在链表一端（头部、尾部其中一个就可以了，视节点指针指向next、pre而定，不需要用双向链表，）进行，这个也叫顺序栈，或者链栈。节点的数据结构和栈的结构（可以有多种形式，反正满足后进先出就行，就按始终在链表头部进行，很好理解）如下：

<span style="font-family:SimSun;font-size:10px;">typedef struct Node
{
int data;
struct Node *next;
}node, SqStack; //栈和节点的数据结构<span style="color:#ff0000;">可以</span>完全一样;</span>

变量的入栈顺序：和编译器有关（http://segmentfault.com/a/1190000002630697），一般没有溢出保护机制是按变量声明的顺序，反之，则逆序。
函数的参数入栈顺序：从右到左，最后是压入函数的地址，如果是数组或者指针，则压入的都是首地址。
栈的生长方向：从上到下（高地址到低地址）关键在栈的定义，定义一个栈——这是高地址，每次压入一个数据，栈指针esp减去4（32操作系统），所以栈顶的地址是最小的。
堆的增长方向：与栈的相反，对的顶部地址最大。

引申：大端小端：
1) Little-Endian就是低位字节排放在内存的低地址端（高位字节排放在内存的高地址端）。
2) Big-Endian就是高位字节排放在内存的低地址端(低位字节排放在内存的高地址端)。

举一个例子，比如数字0x12 34 56 78在内存中的表示形式为：

1)大端模式：
低地址 -----------------> 高地址

0x12 | 0x34 | 0x56 | 0x78

2)小端模式：
低地址 ------------------> 高地址

0x78 | 0x56 | 0x34 | 0x12

可见，大端模式和字符串的存储模式类似。

3）为什么会有大小端模式之分呢？

这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8bit。但是在C语言中除了8bit的char之外，还有16bit的short型，32bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。例如一个16bit的short型x，在内存中的地址为0x0010，x的值为0x1122，那么0x11为高字节，0x22为低字节。对于大端模式，就将0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。小端模式，刚好相反。我们常用的X86结构是小端模式，而KEIL
C51则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

4）常见的字节序

一般操作系统都是小端，而通讯协议是大端的。

4.堆和栈对比
一、预备知识—程序的内存分配

一个由C/C++编译的程序占用的内存分为以下几个部分

1、栈区（stack）— 由编译器自动分配释放，存放函数的参数值，局部变量的值等。其

操作方式类似于数据结构中的栈。

2、堆区（heap） — 一般由程序员分配释放，若程序员不释放，程序结束时可能由OS回

收。注意它与数据结构中的堆是两回事，分配方式倒是类似于链表，呵呵。

3、全局区（静态区）（static）—，全局变量和静态变量的存储是放在一块的，初始化的

全局变量和静态变量在一块区域，未初始化的全局变量和未初始化的静态变量在相邻的另

一块区域。 - 程序结束后由系统释放。

4、文字常量区 —常量字符串就是放在这里的。程序结束后由系统释放

5、程序代码区—存放函数体的二进制代码。

二、例子程序（有前辈将程序员宝典的总结全部写过了，我这儿直接复制来的。如下）

//main.cpp
int   a   =   0;   全局初始化区
char   *p1;   全局未初始化区
main()
{
int   b;   栈
char   s[]   =   "abc";   栈
char   *p2;   栈
char   *p3   =   "123456";   123456/0在常量区，p3在栈上。
static   int   c   =0；   全局（静态）初始化区
p1   =   (char   *)malloc(10);
p2   =   (char   *)malloc(20);
分配得来得10和20字节的区域就在堆区。
strcpy(p1,   "123456");   123456/0放在常量区，编译器可能会将它与p3所指向的"123456"
优化成一个地方。
}

二、堆和栈的理论知识

2.1申请方式

stack: 由系统自动分配。例如，声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间

heap: 需要程序员自己申请，并指明大小，在c中malloc函数，如p1= (char *)malloc(10);
在C++中用new运算符如p2 = new char[10];

但是注意p1、p2本身是在栈中的。

2.2 申请后系统的响应

栈：只要栈的剩余空间大于所申请空间，系统将为程序提供内存，否则将报异常提示栈溢出。

堆：首先应该知道操作系统有一个记录空闲内存地址的链表，当系统收到程序的申请时，会遍历该链表，寻找第一个空间大于所申请空间的堆结点，然后将该结点从空闲结点链表中删除，并将该结点的空间分配给程序，另外，对于大多数系统，会在这块内存空间中的首地址处记录本次分配的大小，这样，代码中的delete语句才能正确的释放本内存空间。另外，由于找到的堆结点的大小不一定正好等于申请的大小，系统会自动的将多余的那部分重新放入空闲链表中。

2.3申请大小的限制

栈：在Windows下,栈是向低地址扩展的数据结构，是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的，在WINDOWS下，栈的大小是2M（也有的说是1M，总之是一个编译时就确定的常数），如果申请的空间超过栈的剩余空间时，将提示overflow。因此，能从栈获得的空间较小。

堆：堆是向高地址扩展的数据结构，是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的，自然是不连续的，而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见，堆获得的空间比较灵活，也比较大。

2.4申请效率的比较：

栈由系统自动分配，速度较快。但程序员是无法控制的。堆是由new分配的内存，一般速度比较慢，而且容易产生内存碎片,不过用起来最方便.另外，在WINDOWS下，最好的方式是用VirtualAlloc分配内存，他不是在堆，也不是在栈是直接在进程的地址空间中保留一块内存，虽然用起来最不方便。但是速度快，也最灵活。

2.5堆和栈中的存储内容

栈：在函数调用时，第一个进栈的是主函数中后的下一条指令（函数调用语句的下一条可执行语句）的地址，然后是函数的各个参数，在大多数的C编译器中，参数是由右往左入栈的，然后是函数中的局部变量。注意静态变量是不入栈的。当本次函数调用结束后，局部变量先出栈，然后是参数，最后栈顶指针指向最开始存的地址，也就是主函数中的下一条指令，程序由该点继续运行。

堆：一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容由程序员安排。

2.6存取效率的比较

char s1[] = "aaaaaaaaaaaaaaa";

char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在运行时刻赋值的；

而bbbbbbbbbbb是在编译时就确定的；

但是，在以后的存取中，在栈上的数组比指针所指向的字符串(例如堆)快。

比如：

#include
void   main()
{
char   a   =   1;
char   c[]   =   "1234567890";
char   *p   ="1234567890";
a   =   c[1];
a   =   p[1];
return;
}

对应的汇编代码

10:   a   =   c[1];
00401067   8A   4D   F1   mov   cl,byte   ptr   [ebp-0Fh]
0040106A   88   4D   FC   mov   byte   ptr   [ebp-4],cl
11:   a   =   p[1];
0040106D   8B   55   EC   mov   edx,dword   ptr   [ebp-14h]
00401070   8A   42   01   mov   al,byte   ptr   [edx+1]
00401073   88   45   FC   mov   byte   ptr   [ebp-4],al

第一种在读取时直接就把字符串中的元素读到寄存器cl中，而第二种则要先把指针值读到edx中，再根据edx读取字符，显然慢了。

2.7小结：

堆和栈的区别可以用如下的比喻来看出：

使用栈就象我们去饭馆里吃饭，只管点菜（发出申请）、付钱、和吃（使用），吃饱了就走，不必理会切菜、洗菜等准备工作和洗碗、刷锅等扫尾工作，他的好处是快捷，但是自由度小。

使用堆就象是自己动手做喜欢吃的菜肴，比较麻烦，但是比较符合自己的口味，而且自由度大。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航