您的位置:首页 > 理论基础 > 计算机网络

TCP/IP协议栈中IP层架构

2017-10-24 13:28 85 查看
/*
*  Main IP Receive routine.
* 对IP头部合法性进行严格检查,然后把具体功能交给ip_rcv_finish
*/
int ip_rcv(struct sk_buff *skb, struct net_device *dev, struct packet_type *pt, struct net_device *orig_dev)
{
const struct iphdr *iph;
u32 len;

/*
* 当网卡处于混杂模式时,丢掉所有接收到的的垃圾数据,不要试图解析它
*/
//noted: 其实也就是丢弃掉不是发往本地的数据包。网卡在混杂模式下会接收一切到达网卡的数据,不管目的地mac是否是本网卡
//noted: 在调用ip_rcv之前,内核会将该数据包交给嗅探器,所以该函数仅丢弃该包
if (skb->pkt_type == PACKET_OTHERHOST)
goto drop;

//noted:该宏用于内核做一些统计,关于网络层snmp统计的信息,也可以通过netstat 指令看到这些统计值
IP_UPD_PO_STATS_BH(dev_net(dev), IPSTATS_MIB_IN, skb->len);

//noted: ip_rcv是由netif_receive_skb函数调用,如果嗅探器或者其他的用户对数据包需要进
//进行处理,则在调用ip_rcv之前,netif_receive_skb会增加skb的引用计数,既该引
//用计数会大于1。若如此次,则skb_share_check会创建sk_buff的一份拷贝。
if ((skb = skb_share_check(skb, GFP_ATOMIC)) == NULL) {
//noted: SNMP所需要的统计数据,忽略
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INDISCARDS);
goto out;
}

//noted:pskb_may_pull确保skb->data指向的内存包含的数据至少为IP头部大小,由于每个
//IP数据包包括IP分片必须包含一个完整的IP头部。如果小于IP头部大小,则缺失
//的部分将从数据分片中拷贝。这些分片保存在skb_shinfo(skb)->frags[]中。
if (!pskb_may_pull(skb, sizeof(struct iphdr)))
goto inhdr_error;

//noted: pskb_may_pull可能会调整skb中的指针,所以需要重新定义IP头部
iph = ip_hdr(skb);

/*
*  RFC1122: 3.2.1.2 必须默默地放弃任何IP帧校验和失败.
*
*  数据报可接收?
*
*  1.  长度至少是一个ip报头的大小
*  2.  版本4
*  3.  校验和正确。(速度优化后,跳过回路校验和)
*  4.  没有虚假的长度
*/
//noted: 检测ip首部长度及协议版本
if (iph->ihl < 5 || iph->version != 4)
goto inhdr_error;

//noted: 确保IP完整的头部包括选项在内存中
if (!pskb_may_pull(skb, iph->ihl*4))
goto inhdr_error;

iph = ip_hdr(skb);

//noted:验证IP头部的校验和
if (unlikely(ip_fast_csum((u8 *)iph, iph->ihl)))
goto csum_error;

//noted:检测ip报文长度是否小于skb->len
len = ntohs(iph->tot_len);
if (skb->len < len) {
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INTRUNCATEDPKTS);
goto drop;
} else if (len < (iph->ihl*4))
goto inhdr_error;

/* 我们的传输介质可能填充缓冲区。现在我们知道这是 我们可以从此帧中削减的真实长度的ip帧
* 注意现在意味着skb->len包括ntohs(iph->tot_len)
*/
if (pskb_trim_rcsum(skb, len)) {
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INDISCARDS);
goto drop;
}

//noted: 设置tcp报头指针
skb->transport_header =
e19f
skb->network_header + iph->ihl*4;

/* 删除任何套接字控制块碎片 */
memset(IPCB(skb), 0, sizeof(struct inet_skb_parm));

/* 因为tproxy,现在必须丢掉socket */
//noted: tproxy是iptables的一附加控件,在mangle表的PREROUTING链中使用,不修改数据包包头,
//直接把数据传递给一个本地socket(即不对数据包进行任何nat操作)。具体百度搜索tproxy
skb_orphan(skb);

//noted: 在做完基本的头校验等工作后,就交由NF_HOOK管理了
//noted: NF_HOOK在做完PRE_ROUTING的筛选后,PRE_ROUTING点上注册的所有钩子都
//返回NF_ACCEPT才会执行后面的ip_rcv_finish函数 ,然后继续执行路由等处理
//如果是本地的就会交给更高层的协议进行处理,如果不是交由本地的就执行FORWARD
return NF_HOOK(NFPROTO_IPV4, NF_INET_PRE_ROUTING, skb, dev, NULL,
ip_rcv_finish);

csum_error:
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_CSUMERRORS);
inhdr_error:
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INHDRERRORS);
drop:
kfree_skb(skb);
out:
return NET_RX_DROP;
}

/*
*  Main IP Receive routine.
* 对IP头部合法性进行严格检查,然后把具体功能交给ip_rcv_finish
*/
int ip_rcv(struct sk_buff *skb, struct net_device *dev, struct packet_type *pt, struct net_device *orig_dev)
{
const struct iphdr *iph;
u32 len;

/*
* 当网卡处于混杂模式时,丢掉所有接收到的的垃圾数据,不要试图解析它
*/
//noted: 其实也就是丢弃掉不是发往本地的数据包。网卡在混杂模式下会接收一切到达网卡的数据,不管目的地mac是否是本网卡
//noted: 在调用ip_rcv之前,内核会将该数据包交给嗅探器,所以该函数仅丢弃该包
if (skb->pkt_type == PACKET_OTHERHOST)
goto drop;

//noted:该宏用于内核做一些统计,关于网络层snmp统计的信息,也可以通过netstat 指令看到这些统计值
IP_UPD_PO_STATS_BH(dev_net(dev), IPSTATS_MIB_IN, skb->len);

//noted: ip_rcv是由netif_receive_skb函数调用,如果嗅探器或者其他的用户对数据包需要进
//进行处理,则在调用ip_rcv之前,netif_receive_skb会增加skb的引用计数,既该引
//用计数会大于1。若如此次,则skb_share_check会创建sk_buff的一份拷贝。
if ((skb = skb_share_check(skb, GFP_ATOMIC)) == NULL) {
//noted: SNMP所需要的统计数据,忽略
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INDISCARDS);
goto out;
}

//noted:pskb_may_pull确保skb->data指向的内存包含的数据至少为IP头部大小,由于每个
//IP数据包包括IP分片必须包含一个完整的IP头部。如果小于IP头部大小,则缺失
//的部分将从数据分片中拷贝。这些分片保存在skb_shinfo(skb)->frags[]中。
if (!pskb_may_pull(skb, sizeof(struct iphdr)))
goto inhdr_error;

//noted: pskb_may_pull可能会调整skb中的指针,所以需要重新定义IP头部
iph = ip_hdr(skb);

/*
*  RFC1122: 3.2.1.2 必须默默地放弃任何IP帧校验和失败.
*
*  数据报可接收?
*
*  1.  长度至少是一个ip报头的大小
*  2.  版本4
*  3.  校验和正确。(速度优化后,跳过回路校验和)
*  4.  没有虚假的长度
*/
//noted: 检测ip首部长度及协议版本
if (iph->ihl < 5 || iph->version != 4)
goto inhdr_error;

//noted: 确保IP完整的头部包括选项在内存中
if (!pskb_may_pull(skb, iph->ihl*4))
goto inhdr_error;

iph = ip_hdr(skb);

//noted:验证IP头部的校验和
if (unlikely(ip_fast_csum((u8 *)iph, iph->ihl)))
goto csum_error;

//noted:检测ip报文长度是否小于skb->len
len = ntohs(iph->tot_len);
if (skb->len < len) {
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INTRUNCATEDPKTS);
goto drop;
} else if (len < (iph->ihl*4))
goto inhdr_error;

/* 我们的传输介质可能填充缓冲区。现在我们知道这是 我们可以从此帧中削减的真实长度的ip帧
* 注意现在意味着skb->len包括ntohs(iph->tot_len)
*/
if (pskb_trim_rcsum(skb, len)) {
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INDISCARDS);
goto drop;
}

//noted: 设置tcp报头指针
skb->transport_header = skb->network_header + iph->ihl*4;

/* 删除任何套接字控制块碎片 */
memset(IPCB(skb), 0, sizeof(struct inet_skb_parm));

/* 因为tproxy,现在必须丢掉socket */
//noted: tproxy是iptables的一附加控件,在mangle表的PREROUTING链中使用,不修改数据包包头,
//直接把数据传递给一个本地socket(即不对数据包进行任何nat操作)。具体百度搜索tproxy
skb_orphan(skb);

//noted: 在做完基本的头校验等工作后,就交由NF_HOOK管理了
//noted: NF_HOOK在做完PRE_ROUTING的筛选后,PRE_ROUTING点上注册的所有钩子都
//返回NF_ACCEPT才会执行后面的ip_rcv_finish函数 ,然后继续执行路由等处理
//如果是本地的就会交给更高层的协议进行处理,如果不是交由本地的就执行FORWARD
return NF_HOOK(NFPROTO_IPV4, NF_INET_PRE_ROUTING, skb, dev, NULL,
ip_rcv_finish);

csum_error:
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_CSUMERRORS);
inhdr_error:
IP_INC_STATS_BH(dev_net(dev), IPSTATS_MIB_INHDRERRORS);
drop:
kfree_skb(skb);
out:
return NET_RX_DROP;
}






'''

NIC Memory 台式机一般都采用内置网卡来连接网络。网卡也叫“网络适配器”,英文全称为“Network Interface Card”

interrupt Generator  中断发生器

DMA Engine 直接存储器存取引擎 DMA驱动 它允许客户端对外设指定DMA的方向、DMA地址、总线宽度、DMA突发长度等等

softirq 软中断; 软件中断为此,整个softirq机制的设计与实现中

            自始自终都贯彻了一个思想:“谁触发,谁执行”(Who marks,Who runs),也即触发

            软中断的那个CPU负责执行它所触发的软中断,而且每个CPU都由它自己的软中断触发与

            控制机制。这个设计思想也使得softirq机制充分利用了SMP系统的性能和特点。

interrupt handler 中断处理程序

pointer to device

backlog  定义是已连接但未进行accept处理的SOCKET队列大小,已是(并非syn的SOCKET队列)。

'''s
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: