Just a journey

结构体 skb_shared_info 成员变量 nr_frags 和 frags

结构体 skb_shared_info 成员变量 nr_frags 和 frags

结构体声明

struct skb_shared_info {
	atomic_t    dataref;
	unsigned short  nr_frags;   
	unsigned short  gso_size;
	/* Warning: this field is not always filled in (UFO)! */
	unsigned short  gso_segs; 
	unsigned short  gso_type;
	__be32          ip6_frag_id;
	struct sk_buff  *frag_list;
	skb_frag_t  frags[MAX_SKB_FRAGS];
};   

nr_fragsfrags 用于支持 Scatter/Gather I/O buffer,这样SKB的数据部分不需要都 放在线性内存空间而是放在 page.

在发送路径上的应用

在函数 tcp_sendmsg 中, 用于存放从应用层拷贝过来的数据。

/*
 skb_tailroom 用于返回此SKB的skb->tail到skb->end之间的空闲距离,如果有的话,   
 可以利用。
 */
if (skb_tailroom(skb) > 0) {
	/* We have some space in skb head. Superb! */
    if (copy > skb_tailroom(skb))
    	copy = skb_tailroom(skb);

    /*
     skb_add_data 拷贝数据的同时计算checksum.
    */
    if ((err = skb_add_data(skb, from, copy)) != 0)
    	goto do_fault;
    } else {
    	int merge = 0;  
		/*
		 i 是 frags 已经使用的数目。
		*/
        int i = skb_shinfo(skb)->nr_frags;	  
        struct page *page = TCP_PAGE(sk);   
        int off = TCP_OFF(sk);  

		/*
		 skb_can_coalesce 检查SKB的frags中最后一个page是否有空闲空间。
		 */
        if (skb_can_coalesce(skb, i, page, off) &&
                    off != PAGE_SIZE) {
             merge = 1;
        } else if (i == MAX_SKB_FRAGS ||
        	(!i &&
            !(sk->sk_route_caps & NETIF_F_SG))) {
                /*
                 执行到这里说明 frags的使用到达上限,需要重新分配一个sk_buff.
                */
                tcp_mark_push(tp, skb);
                goto new_segment;
        } else if (page) {
        	/*  a new page is needed */
            if (off == PAGE_SIZE) {
            	put_page(page);
                TCP_PAGE(sk) = page = NULL;
                off = 0;
            }
        } else
        	off = 0;

在接收路径上的应用

函数 skb_copy_datagram_iovec 用于将数据从socket buffer拷贝到应用层。

    /*
     skb_headlen(skb) 返回的值为 (skb->len - skb->data_len),skb->len   
     为所有TCP负载的长度,skb->data_len 为使用SG功能存放于page中的数据   
     长度。offset 为缓存区中的偏移。 
     */
	int start = skb_headlen(skb);
    int i, copy = start - offset;

    /*
     copy 大于0,说明skb->data 到 skb->tail 之间的线性数据区域依然有数据需要拷贝。
    */
    if (copy > 0) {
        if (copy > len)
            copy = len;
        if (memcpy_toiovec(to, skb->data + offset, copy))
            goto fault;
        if ((len -= copy) == 0)
            return 0;
        offset += copy;
    }   

    /* Copy paged appendix. Hmm... why does this look so complicated? */
    for (i = 0; i < skb_shinfo(skb)->nr_frags; i++) {
        int end;

        BUG_TRAP(start <= offset + len);

        /*
         end 表示此 page 所包含负载的终点,如果offset已经大于等于此end,说明这个page   
         已经拷贝完,那么执行循环的下一次。
         */
        end = start + skb_shinfo(skb)->frags[i].size;   
        if ((copy = end - offset) > 0) {
            int err;
            u8  *vaddr;
            skb_frag_t *frag = &skb_shinfo(skb)->frags[i];
            struct page *page = frag->page;
      
            if (copy > len)
                copy = len;
            vaddr = kmap(page);
            err = memcpy_toiovec(to, vaddr + frag->page_offset +
                         offset - start, copy);
            kunmap(page);
            if (err)
                goto fault;
            if (!(len -= copy))
                return 0;
            offset += copy;
        }

        /*
         累积拷贝负载的起始位置用于下次循环。
        */
        start = end;  
    }
comments powered by Disqus