前言
Linux内核源码分析之setup_arch (三) 基本上把setup_arch主要的函数都分析了,由于距离上一篇时间比较久了,所以这里重新贴一下大致的流程图,本文主要分析的是bootmem_init函数。
代码分析
bootmem_init函数的结构如下:
find_limits通过存储在meminfo中的内存条信息得到低端内存和高端内存的页框编号,分别放入到min、max_low、max_high中。
static void __init find_limits(unsigned long *min, unsigned long *max_low,unsigned long *max_high){...*min = bank_pfn_start(&mi->bank[0]);for_each_bank (i, mi)if (mi->bank[i].highmem)break;*max_low = bank_pfn_end(&mi->bank[i - 1]);*max_high = bank_pfn_end(&mi->bank[mi->nr_banks - 1]);}
arm_bootmem_init对低端内存区域进行管理,流程图如下:
在通过find_limits得到内存的起止页框号之后,通过bootmem_bootmap_pages计算得到需要分配bitmap的大小,分配好bitmap之后调用init_bootmem_node将起止页框号和bitmap信息写入到pgdat中。
/* arch/arm/mm/init.c */static void __init arm_bootmem_init(unsigned long start_pfn,unsigned long end_pfn){...boot_pages = bootmem_bootmap_pages(end_pfn - start_pfn);bitmap = memblock_alloc_base(boot_pages << PAGE_SHIFT, L1_CACHE_BYTES,__pfn_to_phys(end_pfn));node_set_online(0);pgdat = NODE_DATA(0);init_bootmem_node(pgdat, __phys_to_pfn(bitmap), start_pfn, end_pfn);...}
最后就是把memblock管理的内存移交给bootmem来管理,对于memblock中的空闲区域通过free_bootmem将bitmap中对应的bit置零,而已经使用的内存,即memblock中对应的reserved的区域使用reserve_bootmem将bitmap中对应bit置1。
/* arch/arm/mm/init.c */static void __init arm_bootmem_init(...){.../* Free the lowmem regions from memblock into bootmem. */for_each_memblock(memory, reg) {...free_bootmem(__pfn_to_phys(start), (end - start) << PAGE_SHIFT);}/* Reserve the lowmem memblock reserved regions in bootmem. */for_each_memblock(reserved, reg) {...reserve_bootmem(__pfn_to_phys(start),(end - start) << PAGE_SHIFT, BOOTMEM_DEFAULT);}}
在设置好bitmap之后,接下来开始分配对应的page结构体,在分配page结构体内存之前,先统计出各个zone区域内的内存空洞,存放在zhole_size中。
/* arch/arm/mm/init.c */static void __init arm_bootmem_free(unsigned long min, unsigned long max_low,unsigned long max_high){...for_each_memblock(memory, reg) {...if (start < max_low) {unsigned long low_end = min(end, max_low);zhole_size[0] -= low_end - start;}#ifdef CONFIG_HIGHMEMif (end > max_low) {unsigned long high_start = max(start, max_low);zhole_size[ZONE_HIGHMEM] -= end - high_start;}#endif}...free_area_init_node(0, zone_size, min, zhole_size);}
统计好内存空洞之后开始分配page结构体所需要的内存空间,大致流程如下:
calculate_node_totalpages通过zones_size和zholes_size计算出内存页总数和真正可用的内存页数量,分别记录在pgdat->node_span1ab8ned_pages和pgdat->node_present_pages中。
/* mm/page_alloc.c */void __paginginit free_area_init_node(int nid, unsigned long *zones_size,unsigned long node_start_pfn, unsigned long *zholes_size){pg_data_t *pgdat = NODE_DATA(nid);pgdat->node_id = nid;pgdat->node_start_pfn = node_start_pfn;calculate_node_totalpages(pgdat, zones_size, zholes_size);alloc_node_mem_map(pgdat);free_area_init_core(pgdat, zones_size, zholes_size);}
alloc_node_mem_map根据pgdat->node_spanned_pages的大小确定需要分配的page结构体数量,这其中包括了内存空洞部分的区域,分配好之后将起始地址记录到pgdat->node_mem_map中,同时也记录在全局变量mem_map中。
/* mm/page_alloc.c */static void __init_refok alloc_node_mem_map(struct pglist_data *pgdat){...if (!pgdat->node_mem_map) {...start = pgdat->node_start_pfn & ~(MAX_ORDER_NR_PAGES - 1);end = pgdat->node_start_pfn + pgdat->node_spanned_pages;end = ALIGN(end, MAX_ORDER_NR_PAGES);size = (end - start) * sizeof(struct page);map = alloc_remap(pgdat->node_id, size);if (!map)map = alloc_bootmem_node_nopanic(pgdat, size);pgdat->node_mem_map = map + (pgdat->node_start_pfn - start);}if (pgdat == NODE_DATA(0))mem_map = NODE_DATA(0)->node_mem_map;...}
最后通过free_area_init_core初始化page结构体,大致流程如下:
主要作用是设置每个zone结构体的信息,比如zone的可用空间大小等信息,并把每个zone的page结构体初始化,记录自己所属的zone和node_id,同时把page结构体状态设置为PG_reserved,这里是无差别的设置的,至于空闲的内存页会在后续的mm_init::mem_init::free_all_bootmem中重新释放出来;另外,SetPageReserved是通过宏声明的,所以是无法找到该函数的,其定义在page-flags.h中。
总结
bootmem_init函数的作用是分配bitmap和page结构体所需要的空间,同时把已使用的和空闲的内存区域都标记到bitmap中,然后更新每个zone的内存信息,并把属于每个zone内存空间对应的page结构体进行初始化,且全部都设置为PG_reserved状态。