您的位置:首页 > 运维架构 > Linux

深度探索Linux内核之加入一个多播组(最简单的情况)

2011-12-28 11:18 1156 查看
    应用程序通过命令字IP_ADD_MEMBERSHIP把一个socket加入到一个多播组,IP_ADD_MEMBERSHIP是一个IP层的命令字,其调用使用的参数是结构体struct ip_mreq,其定义如下:

    struct ip_mreq

    {

        struct in_addr imr_multiaddr;

        struct in_addr imr_interface;

    };

    该结构体的两个成员分别用于指定所加入的多播组的组IP地址,和所要加入组的那个本地接口的IP地址。该命令字没有源过滤的功能,它相当于实现IGMPv1的多播加入服务接口。

    ip_setsockopt实现了该命令字,它通过调用ip_mc_join_group把socket加入到多播组。

    表示socket的结构体struct inet_sock有一个成员mc_list,它是一个结构体struct ip_mc_socklist的指针,实际上一个该结构体的链表,该结构体的定义如下:

    struct ip_mc_socklist

    {

        struct ip_mc_socklist   *next;

        struct ip_mreqn         multi;

        unsigned int            sfmode;

        struct ip_sf_socklist   *sflist;

    };

    next指向链表的下一个节点;multi表示组信息,即在哪一个本地接口上,加入到哪一个多播组;sfmode是过滤模式,取值为MCAST_INCLUDE或MCAST_EXCLUDE,分别表示只接收sflist所列出的那些源的多播数据报,和不接收sflist所列出的那些源的多播数据报;sflist是源列表,结构体struct ip_sf_socklist的定义如下:

    struct ip_sf_socklist

    {

        unsigned int    sl_max;

        unsigned int    sl_count;

        __u32           sl_addr[0];

    };

    sl_addr是源地址列表,sl_count应该是源地址列表中源地址的数量,sl_max应该是当前sl_addr数组的最大可容纳量(不确定)。对于通过调用IP_ADD_MEMBERSHIP加入的多播组,它会在struct inet_sock的mc_list的链表头添加如下一个节点:

    struct ip_mc_socklist{

        .next = 原来的链表头;

        .multi = 所加入的多播组,和接口信息;

        .sfmode = MCAST_EXCLUDE;

        .sflist = NULL;             即不排除任何源地址,也就是不存在源过滤。

    }

    另外,一个socket所允许加入的多播组的最大数量也是有限制的,mc_list中节点的数量不允许超过sysctl_igmp_max_memberships(缺省为20)。

    ip_mc_join_group还需要通过ip_mreq.imr_interface的指定值找到要加入多播组的那个接口,并为接口设置状态(即该接口要加入哪个多播组,过滤哪些源,也就是为该接口增加一个组,如果要增加的组已存在,则增加该组的引用计数)。代表网络设备接口的结构体struct in_device有一个成员mc_list,这是一个结构体struct ip_mc_list的链表,该结构体的定义如下:

    struct ip_mc_list

    {

        struct in_device    *interface;

        unsigned long       multiaddr;

        struct ip_sf_list   *sources;

        struct ip_sf_list   *tomb;

        unsigned int        sfmode;

        unsigned long       sfcount[2];

        struct ip_mc_list   *next;

        struct timer_list   timer;

        int                 users;

        atomic_t            refcnt;

        spinlock_t          lock;

        char                tm_running;

        char                reporter;

        char                unsolicit_count;

        char                loaded;

        unsigned char       gsquery;

        unsigned char       crcount;

    };

    interface指向网络设备接口,multicast即为加入的组的多播地址,users记录当前有几个socket在该接口上加入了该多播组。sfcount是一个有两个元素的数组,分别记录在该接口上加入多播组的socket的过滤模式为EXCLUDE和INCLUDE的数量,sfmode为该接口本身的过滤模式。sources为源地址列表,该结构体具体内容稍后再分析。timer为主动报告定时器,当一个接口(注意:不是socket)新加入到一个多播组,需要向多播路由器发送一个igmp报告,以通知多播路由器需要向本地网络转发该组的数据报。tm_running是一个标志,如果timer当前正在运行,则置1,否则置0。reporter也是一个标志,如果当前正要开始发送igmp报告,则置该标志为1,否则为0。unsolicit_count是当一个接口新加入到一个多播组时,发送主动报告的次数,值赋为IGMP_Unsolicited_Report_Count(缺省值为2)。loaded也是一个标志,当该接口上的该多播组被加入时,需要通知硬件过滤器,通知完成即置该标志为1,否则为0。

    该结构体比较复杂,先看通过IP_ADD_MEMBERSHIP命令字把一个socket加入到一个新的多播组,会使struct in_device的mc_list中增加一个什么样的节点。下面是生成的节点的情况:

    struct ip_mc_list{

        .interface = in_dev;

        .multiaddr = 多播组地址;

        .source = NULL;         //源过滤列表为空。

        .tomb = NULL;

        .sfmode = MCAST_EXCLUDE;    //EXCLUDE模式,即不过滤任何源。

        .sfcount[MCAST_EXCLUDE] = 1;

        .sfcount[MCAST_INCLUDE] = 0;//即该节点上该多播组有一个socket加入,过滤模式为EXCLUDE。

        .users = 1;  //有一个用户。

        .refcnt = 1; //引用计数为1

        .tm_running = 0;

        .unsolicit_count = 2;

        ... ...

    }

    新生成的节点加入到mc_list链表中后,要通知网络设备接口的硬件,以使它的过滤机制可以接收进该多播组的数据报,同时也要通知多播路由器。

    首先要把多播地址映射成以太网地址,映射规则是把多播IP地址的低23位放到以太网多播地址01-00-5E-00-00-00(16进制)的低23位。因为一个IP组地址有28位有效位(除去高位的1110),所以有可能出现多个组地址被映射成同一个以太网多播地址,具体实现见ip_eth_mc_map。然后把这个mac地址加到硬件的过滤机制中。

    具体的实现在函数dev_mc_add中。代表网络设备接口的结构体struct net_device也有一个成员mc_list,它是一个结构体struct dev_mc_list的链表,该结构体的定义如下:

    struct dev_mc_list

    {

        struct dev_mc_list  *next;

        __u8            dmi_addr[MAX_ADDR_LEN];

        unsigned char   dmi_addrlen;

        int             dmi_users;

        int             dmi_gusers;

    };

    next指向链表下一个节点,dmi_addr是多播mac地址,dmi_addrlen为多播mac地址的长度,dmi_users是在节点被重复到加入到设备上的次数,struct net_device还有一个成员mc_count,用于记录链表中节点的数量。dev_mc_add创建一个新的struct dev_mc_list节点,加入到链表中,并通过调用网络设备接口的成员函数set_multicast_list来启用设备的过滤机制。

    最后一步发送主动成员报告,这里,首先忽略IGMPv1和IGMPv2存在的情况。如果要加入的多播组是IGMP_ALL_HOSTS(224.0.0.1),则不需要发送成员报告。否则启用定时器struct in_device->mr_ifc_timer(接口状态改变定时器),该定时器在设备初始化的时候被建立,其超时处理函数是igmp_ifc_timer_expire,它发送一个IGMPv3的报告,然后再次启用定时器。也就是说,第一个主动成员报告立即发出,然后在一个0到IGMP_Unsolicited_Report_Interval(缺省为10秒)之间的一个时间后,发出第二个主动成员报告,连续发出IGMP_Unsolicited_Report_Count(缺省值为2)个。

    测试环境中要加入的多播组是224.0.1.1,发出的IGMPv3报告如下:

    数据                含义

    22                  第3版成员关系报告

    00                  8bit保留,必须为0

    f8 fc               校验和

    00 00               16bit保留,必须为0

    00 01               组记录的数量,为1

    下面为一条组记录:

    04                  类型为CHANGE_TO_EXCLUDE_MODE,改变到EXCLUDE过滤模式

    00                  辅助数据长度

    00 00               源地址的数量

    e0 00 01 01         组地址224.0.1.1
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息