您的位置：首页 > 理论基础 > 数据结构算法

数据结构图小结

2017-11-06 09:38 176 查看

数据结构中，图是很重要的一部分，比线性表和树型结构更加复杂。线性表中数据有很明显的前驱和后继关系；树型结构中数据有很明显的层次关系，父层和子层，千层饼一样；而图所表示的数据，任意两个之间都可以有关系。首先介绍一些图中的专用名词，下图表示一种常见的图。

       图中数据元素叫做顶点（vertex），如上图中的A、B、C等，顶点之间的连线叫做弧（arc），如<a,b>可以表示从A点到B点的弧，如果是A指向B的弧，那么A为弧尾或初始点，B为弧头或终端点，这种有弧方向的图是有向图（digraph），若两个顶点之间只是用有无连接关系表示的话，就可以用边来表示，此时的图是无向图（undigraph）。假若弧或边上带有权值信息，那么图就称为网，所以图也可以分为无向图、有向图、无向网和有向网四类。对于无向图，相邻的两个顶点互为邻接点，顶点A的度是指和顶点A相关联的边的数目。对于有向图，度分为出度和入度，A的出度就是以A为弧尾的弧的个数，A的入度就是以A为弧头的弧的个数，常见的图中名词有以上这些。

       图的表示法有数组法、邻接表法和十字链表法。当然这些只是常见的，具体的图的存储结构还要跟实际情况结合起来，可以组合搭配使用，不能拘泥于一种方法，领悟其精华，学会变通即可。下面具体讲一下他们的表示方法和创建图的过程。

图的数组表示法

       图的存储结构用数组表示的话，C语言版本的结构如下所示：

[cpp] view
plain copy

#define MAX_VERTEX_NUM 10           //最大顶点vertex数

#define MAX_NAME 5                  //顶点向量字符最长数+1

#define MAX_INIT 65535              //对于网，将值设为无限大表示没有弧存在

typedef int VRType;                 //表示顶点的关系类型，对于无权图，有0和1，对网可以表示其权值

typedef char VertexType[MAX_NAME];  //顶点名字信息

typedef enum{DG, DN, UDG, UDN} GraphKind;//图的类型

typedef struct ArcCell{

    VRType adj;

    //这里可以添加一些其他信息，用来表示弧相关其他信息

}ArcCell, AdjMatrix[MAX_VERTEX_NUM][MAX_VERTEX_NUM];

typedef struct {

    VertexType vexs[MAX_VERTEX_NUM];//顶点向量,就是顶点的名字，可以用字符串表示

    AdjMatrix arcs;                 //邻接矩阵

    int vexnum,arcnum;              //顶点数和弧数

    GraphKind kind;                 //图的类型

}Graph;

       上面都详细的描述了定义的结构体中各个的含义，其实用数组表示图最主要的就是那个矩阵，矩阵中存放着“权值”的信息，其他的就是顶点个数、弧个数、顶点名字等，用一个结构体也是可以的。创建图的话就要根据图的类型进行操作了，我主要创建了无向图和有向网，这两个可以的话剩下两个应该都不难。无向图的表示也最为简单，创建过程如下程序所示：

[cpp] view
plain copy

void CreateUDG(Graph *G)

{

    int i, j, k;

    VertexType  va, vb;                 //临时变量，存储顶点A和B



    printf("Input the number of the vertex and arc:\n");

    scanf("%d %d",&G->vexnum, &G->arcnum);

    printf("input the name of the vertex:\n");

    for(i=0; i<G->vexnum; i++)

        scanf("%s",G->vexs[i]);

    for (i = 0; i < G->vexnum; ++i)      // 初始化邻接矩阵

        for (j = 0; j < G->vexnum; ++j)

        {

            G->arcs[i][j].adj  = 0;      // 无向图，所以都初始值为0

        }

    //根据顶点向量的信息判断两点之间有无连接

    for (k = 0; k < G->arcnum; ++k)

    {

    printf("\nInput the first vertex:\n");

        scanf("%s",va);

        i = Locate(G, va);               //找出va在图中的位置

        printf("\nInput the last vertex:\n");

    scanf("%s",vb);

    j = Locate(G, vb);

        G->arcs[i][j].adj = G->arcs[j][i].adj = 1;    // 无向图，两个顶点是一样的

    }

    G->kind = UDG;

}

       上述程序就是创建无向图的过程，这个只是简单的示范，所以比较简单。对于有向网，稍微复杂一点，就是加了权值，定了弧的方向，实现方式如下所示：

[cpp] view
plain copy

void CreateDN(Graph *G){

    int i,j,k;

    VertexType va,vb;

    printf("Please input the vertexnum and the arcnum:\n");

    scanf("%d %d",&G->vexnum,&G->arcnum);

    for(i=0;i<G->vexnum;i++){

        for(j=0;j<G->vexnum;j++){

            G->arcs[i][j].adj = MAX_INIT;            //初始化为大数，表示达不到或者说没有A到B顶点的弧

        }

    }

    printf("\nInput the name of the vertex:\n");

    for(i=0;i<G->vexnum;i++){

        scanf("%s",G->vexs[i]);

    }

    for(k=0;k<G->arcnum;k++){

        printf("\nInput the first vertex:\n");

        scanf("%s",va);

        i = Locate(G, va);

        printf("\nInput the second vertex:\n");

        scanf("%s",vb);

        j = Locate(G, vb);

        printf("\nInput the weight of the vector:\n");

        VRType m;

        scanf("%d",&m);

        G->arcs[i][j].adj = m;

    }

    G->kind = DN;

}

       需要指出的是，这两个创建过程都有用到locate函数，该函数是为了实现查找到顶点在图中的位置。具体实现如下：

[cpp] view
plain copy

int Locate(Graph *g, VertexType v){

    int i;

    for(i=0; i<g->vexnum; i++){

        if(strcmp(v, g->vexs[i]) == 0)

            return i;

    }

    return -1;

}

        具体的实现方法，可以参见我的源码：https://github.com/clarkzhang56/useful-data-structure/blob/master/Graph/graphwitharray.c

图的邻接表表示法

       邻接表是图的一种链式存储结构。邻接表中，对每个顶点建一个单链表，单链表中的结点表示依附于顶点的边或弧。每个结点包括三部分，该顶点的位置、所指向的下一个结点和弧相关的信息，比如权值。每个链表都有一个表头结点，表头结点包含指向链表的第一个结点的链域和存储顶点名的数据域，具体的结构如下所示：

[cpp] view
plain copy

#define MAX_VEXTEX 10

#define MAX_LEN 5

typedef enum{UDG,UDN,DG,DN} GraphKind;

typedef char VertexType[MAX_LEN];

typedef struct ArcNode{

    int adjvex;             //弧指向的顶点的位置信息

    struct ArcNode *nextArc;        //下一个结点

    int weight;             //权值，当然也可以是其他信息

}ArcNode;

typedef struct VNode{               //表头结点

    VertexType data;            //数据域，存储顶点名称

    ArcNode *firstArc;          //链域，指向第一个结点

}VNode,AdjList[MAX_VEXTEX];

typedef struct Graph{

    int vextexnum,arcnum;

    AdjList vertices;

    GraphKind kind;

}Graph;

       我用邻接表创建了有向网，有向网的实现，最困难的地方在于增加结点信息的时候，比如添加完firstarc，只要让其指向一个新增加的内存即可，但是如果其后面还有结点呢？我最开始的想法是使用双指针，发现效果还不错，这样可以修改firstarc指向的后一个结点的内存信息，即修改其值等，我发现效果还不错。我写的错误程序如下所示（可以在看完整个程序后再看这个也行）：

[cpp] view
plain copy

ArcNode **tmpnextarc = &G->vertices[i].firstArc->nextArc;

while(*tmpnextarc != NULL){

*tmpnextarc = (*tmpnextarc)->nextArc;

}

*tmpnextarc = tmp;

(*tmpnextarc)->nextArc = NULL;

       可是，当我尝试再增加第三个结点的时候，问题出现了，我在print图的时候只能显示第一个和第三个结点的信息，不会显示第二个，我就纳闷了，怎么会没有呢，第二个被我吃了？想了很久，终于想明白了。当firstarc新增一个结点的时候，双指针可以指向新结点的地址，同时修改其地址的内容，但是再增加一个结点的时候，双指针指向的内存地址没有变化，即使让它指向另一个地址，其也不能修改那一个地址的内容，因为指向另一个地址的时候，它就不再是双指针了。修改的地址还是原来的地址，所以这种方法行不通。后来我又看了一下书本（基础都在书本啊），发现可以用指针的nextarc指向firstarc，然后赋值给firstarc就行了。这种方法是将结点加在了firstarc的头部，而不是尾部，比较厉害。具体的创建有向网的程序如下所示：

[cpp] view
plain copy

void CreateDN(Graph *G){

    printf("Create the Digraph Net:\n");

    int i,j,k;

    VertexType vf,vl;

    printf("Please input the vextexnum and the arcnum:\n");

    scanf("%d %d",&G->vextexnum,&G->arcnum);

    printf("Please input the name of the vextexnum:\n");

    for(i=0;i<G->vextexnum;i++){              //初始化

        scanf("%s",G->vertices[i].data);

        G->vertices[i].firstArc = NULL;

    }

    for(k=0;k<G->arcnum;k++){

        printf("Please input the first vertex:\n");

        scanf("%s",vf);

        printf("Please input the last vertex:\n");

        scanf("%s",vl);

        i = Locate(G,vf);                       //寻找顶点的位置，和数组表示图那里一样

        j = Locate(G,vl);

        if(i != -1 && j != -1){

            ArcNode *tmp = (ArcNode*) malloc (sizeof(ArcNode));

            tmp->adjvex = j;

            printf("Please input the weight:\n");

            scanf("%d",&tmp->weight);

            /*  以下实现方法比较方便，易懂还方便    */

            tmp->nextArc = G->vertices[i].firstArc;

            G->vertices[i].firstArc = tmp;

        }

    }

    G->kind = DN;

}

       有向网就创建成功了。另外三个都比这个要简单，我就不写了。具体文档可以参考如下链接：https://github.com/clarkzhang56/useful-data-structure/blob/master/Graph/graphwithadjacencylist.c

图的十字链表表示法

       虽然数组和邻接表都可以作为图的存储结构，但是它们都有一些弊端：数组表示法要浪费很多的空间；邻接表可以容易查找到某一顶点的出度，但是很难找到该顶点的入度。为了解决这个问题，可以使用十字链表。十字链表其实就是邻接表的升级版。它只针对有向图（因为无向图的话没有入度-_-!），每一条弧都有一个结点，对应每一个顶点也有一个结点，弧结点包括：弧头、弧尾、同一弧头的弧、同一弧尾的弧和弧信息（比如权值），顶点结点包括：顶点名字、以该顶点为弧头的第一个结点和以该顶点为弧尾的第一个结点。具体结构定义如下所示：

[cpp] view
plain copy

#define MAX_NUM 5

#define MAX_VEX_NUM 20

typedef char VexType[MAX_NUM];

typedef struct AcrBox{

    int tailvex,headvex;        //弧尾和弧头的位置

    struct AcrBox *hlink;       //相同弧头的下一结点

    struct AcrBox *tlink;

    int weight;

}ArcBox;

typedef struct VexNode{

    VexType data;

    ArcBox *firstin;            //指向以该顶点为弧头的第一个结点

    ArcBox *firstout;

}VexNode;

typedef struct {

    VexNode xlist[MAX_VEX_NUM];

    int vexnum, arcnum;

}GraphDN;

       这里我只以有向网为例子，因为有向网的稍微复杂一点，创建有向网的难点也在于增加结点的部分，所以这里也采用了和邻接表法相同的方法，即加在头部而不是尾部的方法。具体创建有向网的过程如下：

[cpp] view
plain copy

void CreateDNgraph(GraphDN *G){

    int i,j,k;

    VexType tail,head;

    printf("Creating the Diagraph Net with orthogonal list......\n");

    printf("Input the num of the vextex and arc:\n");

    scanf("%d %d",&G->vexnum, &G->arcnum);

    printf("Input the vextex name:\n");

    for(i=0; i<G->vexnum; i++){               //初始化

        scanf("%s",G->xlist[i].data);

        G->xlist[i].firstin = G->xlist[i].firstout = NULL;

    }

    for(k=0; k<G->arcnum; k++){

        printf("Input the tailvex name:\n");

        scanf("%s",tail);

        printf("Input the headvex name:\n");

        scanf("%s",head);

        i = Locate(G, tail);

        j = Locate(G, head);

        if(i != -1 && j != -1){

            ArcBox *arcbox = (ArcBox *)malloc(sizeof(ArcBox));

            arcbox->tailvex = i;

            arcbox->headvex = j;

            printf("Input the weight:\n");

            scanf("%d",&arcbox->weight);

            /*  难点和精华，搞清楚头和尾很重要 */

            arcbox->tlink = G->xlist[i].firstout;

            G->xlist[i].firstout = arcbox;

            arcbox->hlink = G->xlist[j].firstin;

            G->xlist[j].firstin = arcbox;

        }else{

            printf("Not the vextex name.\n");

            --k;

        }

    }

}

       具体可以参考右边链接：https://github.com/clarkzhang56/useful-data-structure/blob/master/Graph/graphwithorthogonallist.c

图的遍历

       图的遍历有深度优先搜索（Deepth first search）和广度优先搜索（Breadth first search），二者效率是一样的，时间复杂度为O（n+e）。

深度优先搜索

       顾名思义，就是一步一步先搜“深”的，再回过头来搜“浅”的，这就要用到迭代了。搜索就是遍历整个图，把所有顶点遍历完，这就需要先定义一个数组，用来表示该顶点是否访问过。如果没访问过，就进行搜索，可以通过打印顶点名字表示搜索了，搜索后还要把该顶点表示为搜索过了。数组表示法有向网的深度优先搜索如下所示：

[cpp] view
plain copy

#define true 1

#define false 0

typedef int bool;

bool visited[MAX_VERTEX_NUM];

void DFS(Graph *g, int v){

    int i;

    visited[v] = true;

    printf("%s  ",g->vexs[v]);

    for(i=0; i<g->vexnum; i++){

        if(g->arcs[v][i].adj != 65535 && visited[i] == false)    //为最大数表示没有弧存在

            DFS(g, i);

    }

}

void DFSgraph(Graph *G){

    int i;

    for(i=0; i<G->vexnum; i++){

        visited[i] = false;

    }

    for(i=0; i<G->vexnum; i++){

        if(!visited[i]) DFS(G, i);

    }

}

       需要说明的是，在C语言中木有bool，true和false，所以都要自己定义。图的另外两种表示法的深度优先搜索和这个都类似。

广度优先搜索

       这种搜索方式就和树的逐层遍历一样，先搜索A指向的所有顶点，然后搜索A指向的第一个顶点所指向的所有顶点，直到遍历完图，如果还有未搜索的，就再搜索它，和深度优先搜索的不同之处仅仅在于顶点的访问顺序不同。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航