人口与城市研究

基于土地利用的中国农业人口格网分布特征分析

  • 米瑞华 ,
  • 倪世龙 ,
  • 刘书敏
展开
  • 延安大学经济与管理学院,陕西 延安 716000

米瑞华(1983-),女,博士,副教授,主要从事人口经济学、空间人口学研究. E-mail:

收稿日期: 2024-07-30

  修回日期: 2024-10-12

  网络出版日期: 2026-03-11

基金资助

国家社科基金一般项目(21BRK033)

Analysis of grid distribution characteristics of agricultural population in China based on land use data

  • Ruihua MI ,
  • Shilong NI ,
  • Shumin LIU
Expand
  • School of Economic and Management, Yan’an University, Yan’an 716000, Shaanxi, China

Received date: 2024-07-30

  Revised date: 2024-10-12

  Online published: 2026-03-11

摘要

高精度农业人口空间分布研究是构建现代农业产业体系的基础性工作,对培育农业新质生产力具有重要决策价值。基于第七次中国人口普查分县数据与中国土地利用遥感监测数据集(分辨率1 km),探索了农业人口格网化方法,实现了1 km格网尺度的中国农业人口密度可视化表达,验证指标显示数据结果具有良好的精度。结果表明:(1) 中国农业人口沿胡焕庸线具有显著分异特征,东南半壁农业人口格网密度均值(30.57人·km-2)是西北半壁(1.92人·km-2)的15.9倍。(2) 农业人口分布沿地势三级阶梯下降而梯度递增,密度分别为0.98人·km-2、11.27 人·km-2和30.76人·km-2。(3) 各个农业区的地形与气候对农业人口分布影响较大,温暖湿润的低海拔农业区农业人口密集,高寒干旱的高原丘陵农业区农业人口相对稀疏。研究建议实施差异化的数字农业推进策略,重点加强黄淮平原区等农业人口密集地区的农业数字化转型,促进生态脆弱区的特色农旅融合,加快培育新型职业农民。

本文引用格式

米瑞华 , 倪世龙 , 刘书敏 . 基于土地利用的中国农业人口格网分布特征分析[J]. 干旱区地理, 2025 , 48(6) : 1006 -1019 . DOI: 10.12118/j.issn.1000-6060.2024.460

Abstract

This study addresses the critical need for precise agricultural population distribution data to inform modern agricultural system development and policy formulation. We integrated country-level demographic data from the Seventh National Population Census with the China Land Use Remote Sensing Monitoring Dataset to develop a novel grid-based spatial distribution model. This methodological approach enabled the first comprehensive visualization of China’s agricultural population density at a 1 km resolution, with validation metrics confirming the high statistical reliability of the results. Our spatial analysis revealed three significant geographic patterns: (1) The Hu Huanyong Line (Hu Line) presents a profound demographic divide, with southeastern regions exhibiting an average agricultural population density (30.57 persons·km-2) nearly 15.9 times higher than northwestern regions (1.92 persons·km-2). (2) Agricultural population distribution follows China’s three-tiered topographical gradient, with densities increasing significantly from the western plateau (0.98 persons·km-2) through the central highlands (11.27 persons·km-2) to the eastern plains (30.76 persons·km-2). (3) Environmental determinants strongly influence agricultural settlement patterns, creating a clear dichotomy between densely populated warm, humid, low-altitude agricultural zones, and sparsely distributed cold-arid plateau and hilly agricultural regions. These findings provide an empirical basis for targeted agriculture development strategies: Prioritizing digital agriculture technologies in high-density regions like the Huang-Huai Plain; developing integrated agritourism models in ecologically sensitive areas; and implementing specialized training programs to cultivate a professional agricultural workforce adapted to regional conditions.

改革开放前,中国的农业人口占总人口比重长期保持在80%以上,农业人口的空间格局对总人口分布具有决定性影响。胡焕庸在《安徽省之人口密度与农产区域》《常熟的农业生产和人口分布》等具有开创性意义的学术成果中,将人口分布与耕地、农产、地形、降雨等因素结合,发现人口分布很大程度上取决于各地的农业生产率[1]。伴随工业化和城镇化进程,大量农村剩余劳动力向非农部门转移,重塑了中国的人口分布格局。农村青壮年劳动力的持续流失导致农业劳动力老弱化,逐渐成为制约农业高质量发展的突出问题[2]。高精度农业人口空间分布研究是构建现代农业产业体系的基础性工作。透过农业人口空间分异的视角,可以深刻洞悉乡村振兴战略和农业现代化的人力资源要素空间格局,对于因地制宜编制乡村振兴规划、培育高素质职业农民、优化农业资源配置具有重要意义,可服务于制定差异化的农业扶持政策,推动农业高质量发展,提升我国农业综合竞争力。
目前关于农业人口分布的研究成果总体较少,主要采用农业人口密度图[3-5]、人口分布结构指数[4]、人口重心和空间不均衡指数[5]、分形指数[6]、人口数据格网化[7]等方法,探究农业人口分布的主要特点。相关研究发现,中国农业人口分布具有空间正自相关性和人口分形特征[6],且空间分布不均衡。农业人口分布与自然地理条件息息相关[3],受地形地貌的直接影响[6],在自然条件优越的地区分布密集[5]。伴随工业化和城镇化进程,农业人口密度快速下降,并通过职业转变和空间迁移向城市聚集[7]。既有成果为农业人口分布研究奠定了重要基础,但仍存在改进空间。首先,以往研究大多采用“乡村人口”[3]或“农村户籍人口”[5]来指代农业人口。但“农业人口”是一个经济概念,而“农村人口”是一个地理概念[1]。步入工业和信息化社会以来,大量农村人口分化为兼业农民或进入非农生产领域,还有一些城镇人口却具有了“新农人”的职业身份[8]。因此,应准确区分“农村人口”与“农业人口”以提升研究的严谨性。其次,已有研究成果主要基于省级[3]、区县级[4-5]、乡镇级[6]等行政区尺度展开分析。这虽然能一定程度上揭示农业人口分布的基本特征,但难以揭示行政区内部农业人口分布的异质性,无法避免因行政区面积悬殊而导致的统计偏差,存在地学研究中的“可变面元问题(MAUP)”[9]。最后,现有人口格网数据集主要针对总人口规模进行格网化(如世界网格人口数据集、WorldPop数据集等),针对农业人口等专题人口数据的格网化研究成果相对罕见[7],专题人口数据的高精度模拟有待技术改进和创新。
文章利用中国第七次人口普查数据中的农业人口数据和2020年土地利用数据,探索了一种精度优良、结果可验证的农业人口格网化方法,得到1 km、10 km和50 km农业人口格网数据集,其中1 km农业人口格网数据能非常清晰地展示农业人口分布的细节信息。与既有的农业人口分布研究成果相比,该数据集具有更高的空间信息表达度和空间分辨率,可以准确捕捉我国农业人口分布的空间分异特征,有效避免行政区单元面积大小不一所造成的尺度混杂问题,减轻了可变面元问题导致的统计偏差[10],拓展了专题人口格网化研究的方法和成果,可为优化农业资源布局、推动农业高质量发展和乡村全面振兴提供科学决策支撑。

1 研究区概况

中国地形地貌复杂多样,地势自西向东分为三级阶梯。位于西部的阿尔金山脉、祁连山脉和横断山脉是地势一、二级阶梯的分界线,位于东部的大兴安岭、太行山脉、巫山和雪峰山等山脉是地势二、三阶梯的分界线,平均海拔随地势三级阶梯由西至东逐级降低(图1a)。气温自南到北逐渐降低,形成热带、亚热带、暖温带、温带、寒温带与青藏高原垂直温度带6个温度带;降水量由东南向西北递减,形成湿润、半湿润、干旱和半干旱4个干湿地区。现代农业区划(一级区划)反映了自然地理和经济社会因素影响下农业耕作条件的区域异质性[11]图1b)。限于数据原因,研究仅针对中国2843个县级行政区(不含香港、澳门和台湾地区)。
图1 研究区示意图

Fig. 1 Schematic diagram of the research area

2 数据与方法

2.1 数据来源

文章使用的数据主要包括:农业人口数据、行政区划数据、土地利用遥感监测数据、地势三级阶梯数据和全国现代农业区划数据。其中,农业人口数据来自2020年《第七次全国人口普查分县资料》各行业门类人口(长表数据)中的“农林牧渔业人口”数据。该数据共抽样调查中国农业人口1.35×107人。根据10%的抽样比例,可合理估算各区县农业人口规模。2020年中国行政区划矢量数据来源于国家自然资源部标准地图服务系统(http://bzdt.ch.mnr.gov.cn)。中国土地利用遥感监测数据集(CNLUCC2020)来源于资源环境科学数据注册与出版系统[12]。该数据使用国家尺度1:100000比例尺,包括耕地、林地、草地、水域、城乡、工矿、居民用地和未利用土地等用地类型,其中耕地又分为水田和旱地,城乡、工矿、居民用地分为城镇用地、农村居民点和其他建设用地。中国现代农业区划(一级区划)数据通过《中国农业地域分异与现代农业区划方案》研究团队申请获取[11],地势三级阶梯数据参考相关研究成果绘制[13]

2.2 研究方法

人口数据格网化方法常以人口普查数据[14-15]和人口统计数据[16]为基础,结合土地利用[7,14]、夜间灯光[17-18]、兴趣点[19]、位置数据[20]、GPS跟踪数据[21]、环境因子[22]、住宅属性[23]或其他社会感知数据,采用核密度估计[24]、随机森林模型[25]、相似度匹配模型[26]等方法,将人口数据分配到格网单元[27],从而在缓解可变面元问题的同时,显著增强人口分布的细节信息,得到更精细的人口空间化成果[28]。参考既有成果,文章基于土地利用类型数据实现农业人口数据由行政单元向格网单元的转换。农业人口数据格网化过程包括适宜格网选择、地类权重确定、格网密度计算和格网数据可视化4个步骤。

2.2.1 选择适宜格网

适宜的格网尺度可以更好地表达农业人口分布的空间特征和区域异质性[29]。格网尺度过大会导致数据的空间表现力降低[30],过小则不利于空间关系表达度的提升[31],且会导致数据冗余。既有研究往往因研究区域和数据用途不同而选取10 km[25]、5 km[20]、1.5 km[7]、1 km[22,32]、100 m[33]等不同的格网尺度。米瑞华等[34]基于最小行政区面积计算适宜格网尺寸,既避免格网过大导致面积较小的行政区落入同一个格网,又避免格网过小而导致的空间关系表达度降低。确定适宜格网尺度的公式为:
g = S m i n π
式中:g为适宜格网边长; S m i n为最小行政区面积。经测算, S m i n 10   k m 2,故g应小于1.78 km。为了提升成果之间的横向可比性[22,24],选择适宜格网边长为1 km,并以10 km和50 km格网进行尺度对比验证。使用创建渔网工具(Create Fishnet)生成格网,以国界线修剪格网(Clip)并计算每个格网的面积an(下标n为格网编号)。

2.2.2 确定地类权重

基于土地利用类型进行农业人口格网化的关键在于地类权重的确定。相关研究认为,农村居民点包括农林牧场的生活区,以及一切村落、放牧地区的帐篷、人烟稀少地区的独立房屋等[1],是农业人口进行生产和生活活动的基本场所;水田、旱地是农业生产活动较为集中的用地类型;城镇用地、其他建设用地、林地、草地等地类上的农业活动相对较低[35],水域和未利用土地上的农业人口更为稀少,但并未减少到零。使用逐步回归法,对中国区县级农业人口规模和土地利用类型构建多元线性回归模型,发现农村居民点对农业人口具有最强的正向解释力,水田、旱地、林地、城镇用地和水域对农业人口规模的解释力逐渐下降,其他建设用地、草地和未利用土地的解释力在统计上不显著。结合相关文献和多元线性回归结果,采用专家打分法对权重进行赋值(表1)。对最佳权重方案的选择遵循以下原则:(1) 格网化成果需体现不同用地类型上农业人口分布的异质性特征,符合农业人口居住、生活和农业生产的经验现实。(2) 在区县总人口规模的约束下,农业人口格网密度值需在相邻县级行政区的边界上自然过渡。(3) 在海拔、地形、气温、降水等农业生产条件相近的情况下,不同区县同一用地类型上的农业人口格网密度值需非常接近。经模拟比较,发现权重1的拟合结果最满足以上三原则,能够反映农业人口居住和工作的主要空间特征,故设定权重方案1为2020年中国农业人口格网化的最佳权重方案。
表1 土地利用类型的权重

Tab. 1 Weighting of land use types

土地利用类型 地类
代码
编号
j
权重(fj
方案1 方案2 方案3
水田 11 1 20.00 12.00 10.00
旱地 12 2 7.00 5.00 4.00
林地 20 3 3.00 2.20 2.00
草地 30 4 3.00 3.50 1.90
水域 40 5 0.45 0.80 0.09
城镇用地 51 6 3.00 3.00 5.00
农村居民点 52 7 3.50 3.00 5.00
其他建设用地 53 8 60.00 70.00 72.00
未利用土地 60 9 0.05 0.50 0.01

2.2.3 密度计算公式

对土地利用类型数据、县级行政区划数据和1 km格网数据进行地图叠加(Intersect),得到的最小多边形拥有唯一行政区属性(i)、唯一土地利用类型属性(j)和唯一格网属性(n)。计算最小多边形面积(am,下标m为最小多边形编号),并通过汇总求和(Summarize)得到ij类用地面积($a_{i j}$)。ij类用地的农业人口密度(Dij)的计算公式如下:
D i j = p i j = 1 n ( a i j × f j ) × f j
式中: p i为中国人口普查资料公布的i县农业人口数; f jj类用地的权重; a i j × f jij类用地的加权面积; j = 1 n ( a i j × f j )i县的加权面积和; p i / j = 1 n ( a i j × f j )i县农业人口按照加权面积均匀展布时的基准密度。

2.2.4 格网数据可视化

基于唯一行政区属性和唯一土地利用类型,为每一个最小多边形赋予相应的 D i j。令 D i j乘以 a m,得到最小多边形上的农业人口数 p m 。基于最小多边形的格网属性(n),汇总求和每一格网上的农业人口数 p n ;令 p n除以格网面积(an),得到每一格网的农业人口密度 D n 。最后,使用“自然断点法”自动分级,再以“手动”方式对上下界取整分级显示,绘制中国农业人口格网密度分布图,实现农业人口格网数据的空间可视化。

3 结果与分析

3.1 胡焕庸线两侧的农业人口分布

以胡焕庸线为界,分析中国农业人口1 km格网分布的空间分异格局(图2)。由图2可知,在地形、海拔、季风、气温和降水等自然因素的影响下,胡线东南半壁具有相对较高的农业生产力和人口承载力,农业人口密度相对较高。与此同时,在高海拔、山地纵横、干旱半干旱和高寒气候等自然因素的影响下,胡线西北半壁的农业以畜牧业、特色经济作物为主,农业人口密度整体较低,且主要聚集于农业耕作条件相对较好的平原、河谷、台塬、坝子、绿洲等局部区域,在青藏高原、沙漠地带、生态保护区和水源涵养区分布极为稀疏。总体而言,在气温、降水、地形、海拔等多种因素的影响下,胡焕庸线不仅是中国人口分布的重要分界线,也是我国农业人口分布的重要分界线。农业人口分布以胡线为界呈现出明显的“东高西低”特征。
图2 中国农业人口1 km格网密度分布

Fig. 2 Density distribution of 1 km grid of China’s agricultural population

统计胡焕庸线东南半壁和西北半壁的国土面积、人均耕地与农业人口密度情况(表2),发现胡线东南半壁以42.65%的国土面积分布着全国98.14%的水田和77.86%的旱地,聚集着全国92.22%的农业人口,农业人口密度为30.57人·km-2,农业人口人均耕地面积为1.18 hm2。而胡线西北半壁57.35%的国土面积上仅有全国1.86%的水田和22.14%的旱地,加之该地区水热条件较差,不利于农业耕作,农业人口仅占全国的7.78%,密度仅为1.92人·km-2,农业人口人均耕地面积约为2.86 hm2
表2 胡焕庸线两侧农业人口分布情况

Tab. 2 Basic situation of agricultural population distribution on both sides of the Hu Huanyong Line

胡焕庸线两侧 国土面积占比/% 水田占比/% 旱地占比/% 农业人口
占比/% 密度/人·km-2 人均耕地面积/hm2
东南半壁 42.65 98.14 77.86 92.22 30.57 1.18
西北半壁 57.35 1.86 22.14 7.78 1.92 2.86
合计 100.00 100.00 100.00 100.00 - -

3.2 地势三级阶梯上的农业人口分布

人口密度等值线法是将地质、气象、水文等领域的等值线图引入人口分布研究[36],将人口密度相同的地区用等值线连接在一起[37],通过略去不必要的细节,更简洁清晰地反映人口地域分布的规律[1]。等值线的走向、疏密变化和弯曲情况可以刻画人口分布的空间形态和疏密变动。等值线密集,说明农业人口疏密变化显著,反之则表示分布较为均匀。等值线闭合,说明此处存在农业人口密度的高值中心或低值中心,进而根据闭合中心的线条颜色和刻度判断其为高值或低值中心。
为了分析农业人口在三大地形阶梯上的分布特征,基于10 km农业人口格网密度数据,绘制农业人口密度等值线图(图3)。由图3可知,三大地形阶梯上的农业人口分布差异显著。第一级阶梯上等值线非常稀疏且数量少,说明农业人口密度低且分布相对均匀。第二级阶梯上等值线疏密变化较大,说明农业人口密度显著增加且空间疏密变化较大。第二级阶梯北部水热条件相对不足,等值线较为稀疏;第二级阶梯中南部水热条件良好,等值线相对密集且闭合中心较多,反映该区域农业人口疏密变化较为剧烈,存在若干农业人口密度高值区。第三级阶梯上的等值线最为密集,且存在明显的区域差异。第三级阶梯北部寒冷且地形较复杂,农业人口疏密变化剧烈,其中部平原区存在若干农业人口密度峰值区,而其南部丘陵区水热条件良好,农业人口密度相对较高,但因地形而存在峰谷交替变化。整体来看,海拔因素对农业人口空间分布影响显著,农业人口密度依地势三级阶梯的高度下降而逐渐增加,地势三级阶梯的分界线一定程度上也是中国农业人口分布的重要分界线。
图3 中国农业人口密度等值线

Fig. 3 Contour lines of agricultural population density in China

统计中国地势三级阶梯上的农业人口分布情况(表3),发现第一级阶梯的国土面积占比达到27.71%,但水田和旱地仅占全国的0.20%和2.35%。由于耕地稀少,第一级阶梯上仅分布全国1.92%的农业人口,密度为0.98 人·km-2。第二级阶梯的国土面积占比达43.13%,水田和旱地占比为22.55%和42.59%,分布了全国34.47%的农业人口,密度为11.27 人·km-2。第三级阶梯的国土面积占比仅为29.16%,但水田和旱地占比高达77.25%和55.06%,且水热条件相对优良,因此第三级阶梯上分布着全国63.61%的农业人口,密度为30.76 人·km-2。总体而言,中国地势三级阶梯上农业人口分异主要受海拔因素影响,也与不同阶梯上的耕地占比和农业耕作条件密切相关。
表3 地势三级阶梯的农业人口分布情况

Tab. 3 Basic situation of agricultural population distribution on the three tiered terrain ladder

地势三级阶梯 国土面积占比/% 水田占比/% 旱地占比/% 农业人口
占比/% 密度/人·km-2 人均耕地面积/hm2
第一级阶梯 27.71 0.20 2.35 1.92 0.98 1.23
第二级阶梯 43.13 22.55 42.59 34.47 11.27 1.43
第三级阶梯 29.16 77.25 55.06 63.61 30.76 1.25
合计 100.00 100.00 100.00 100.00 - -

3.3 各农业区的农业人口分布

基于中国现代农业一级区划揭示中国农业人口的空间分异特征(图4)。结果表明,中国各农业区的农业人口空间分布呈现显著差异,且一级农业区划中农业人口的疏密分布表现出明显的空间集聚特征(图4a)。其中,黄淮平原区(图4b)和京津冀鲁平原丘陵区(图4c)由于地势平坦、土地肥沃,农业生产条件优良,农业人口分布最为密集。四川盆地区(图4d)、华南热作区(图4e)和长江中下游平原区(图4f)平均海拔较低,水热条件良好,灌溉农业发达,农业人口集聚水平较高。东南沿海丘陵区(图4g)地形起伏不大,水热条件良好,农业种植多以茶树、果树以及水稻等为主,农业人口分布相对密集。云贵高原区(图4h)水热条件相对较好,但受横断山脉、武陵山等山脉影响,地貌复杂,农业人口分布疏密相间。东北平原区(图4i)平均气温较低,但土地肥沃、地势平坦,农业人口在松嫩平原和辽河平原密度最高。江南丘陵区(图4j)水热条件良好,地形相对平缓,农业人口在鄱阳湖平原等地密度较高。黄土高原区(图4k)气候干旱,气温低,降水少,地形地貌复杂,农业生产条件相对较差,农业人口密度整体偏低,在关中平原形成了狭长的农业人口聚集区。东北山地丘陵区(图4l)气温低,且受大小兴安岭和长白山脉影响,地势起伏大,农业人口密度相对较低。内蒙古高原区(图4m)地势较平坦,但温湿度较低,农业人口自北向南递增,在河套平原分布相对密集。甘新沙漠高原区(图4n)气候干旱,地形起伏较大,农业人口主要分布于河谷绿洲地带。青藏高原区(图4o)海拔高,低氧低温干旱,农业人口分布非常稀疏。总体而言,受气候、地形、海拔等自然地理因素的制约,各农业区的农业人口分布呈现出显著的空间集聚特征。农业人口在温热带、低海拔、平原地带的农业区上分布较为密集,在高寒干旱、高原丘陵地带的农业区上分布相对稀疏。与此同时,受到工业化、城镇化影响,全国各城市主城区的用地类型主要为城镇用地,农业生产的机会成本高,农业人口密度较低。
图4 中国各农业区的农业人口1 km格网分布

Fig. 4 Density distributions of 1 km grid of agricultural population on agricultural regions in China

统计中国各个农业区的农业人口分布情况(表4),发现国土面积占比2.97%的黄淮平原区拥有全国7.47%的水田和11.98%的旱地,聚集着全国13.97%农业人口,农业人口密度最高。京津冀鲁平原丘陵区以3.41%的国土面积,拥有0.54%的水田和12.70%的旱地,聚集了全国12.87%的农业人口,农业人口密度仅次于黄淮平原区。四川盆地区、华南热作区和长江中下游平原区的农业人口密度也均大于30人·km-2,东南沿海丘陵区、云贵高原区、东北平原区、江南丘陵区和黄土高原区的农业人口密度均大于20人·km-2。农业人口密度最低的4个农业区分别是东北山地丘陵区、内蒙古高原区、甘新沙漠高原区和青藏高原区,其农业人口密度均小于4 人·km-2。其中,青藏高原区以24.07%的国土面积,仅有全国0.43%的水田和2.21%的旱地,农业人口比重仅为1.97%,农业人口密度为全国最低。总体而言,农业人口在不同农业区上的分布特征与各农业区的耕地面积、平均海拔、地形地貌、水热条件等因素密切相关。
表4 中国各个农业区上的农业人口分布情况

Tab. 4 Basic situation of agricultural population distribution on agricultural regions in China

区划编号 现代农业区划 国土面积
占比/%
水田
占比/%
旱地
占比/%
农业人口
占比/% 密度/人·km-2 人均耕地面积/hm2
黄淮平原区 2.97 7.47 11.98 13.97 66.52 1.02
京津冀鲁平原丘陵区 3.41 0.54 12.70 12.87 53.39 0.98
四川盆地区 3.63 12.50 7.69 9.19 35.85 1.27
华南热作区 3.55 6.80 3.78 7.99 31.94 0.75
长江中下游平原区 4.38 29.13 3.27 9.88 31.89 1.30
东南沿海丘陵区 1.68 5.30 0.73 3.30 28.21 0.75
云贵高原区 5.87 7.87 6.58 10.54 25.37 0.86
东北平原区 5.01 7.11 15.34 8.73 24.66 1.99
江南丘陵区 5.22 17.07 2.56 8.55 23.14 0.95
黄土高原区 4.88 0.50 12.37 7.19 20.84 1.71
东北山地丘陵区 6.58 4.49 6.62 1.68 3.61 4.77
内蒙古高原区 6.72 0.76 6.45 1.67 3.53 3.92
ⅩⅢ 甘新沙漠高原区 22.03 0.03 7.72 2.47 1.58 3.08
ⅩⅣ 青藏高原区 24.07 0.43 2.21 1.97 1.16 1.17
合计 100.00 100.00 100.00 100.00 - -

3.4 结果验证

人口分布的复杂性与流动性,以及拟合模型中难以避免的方法和数据的局限,导致模拟得到的人口格网数据集与实际人口分布之间往往存在误差[38]。为了评估农业人口格网数据集的质量,需要对不同格网尺度和不同权重因子下的拟合结果进行精度验证。

3.4.1 权重方案有效性验证

为了检验权重赋值对研究精度的影响,绘制不同权重方案下的中国农业人口1 km格网密度图(图5)。由图5可见,3种权重方案虽然在农业人口分布模拟的细节信息上呈现微弱差异,但均能反映中国农业人口分布的主要空间特征,其研究结果未因权重设置而出现显著差异。
图5 权重方案的有效性验证

Fig. 5 Validity verification of weight schemes

为进一步验证权重赋值对数据集精度的影响,借鉴肖东升等[39]的做法,以人口普查数据中的农业人口统计值为真值,将农业人口格网数据集还原到区县尺度,再与普查数据进行比较,计算绝对估计误差和相对估计误差:
A E E i = P E i - P i
R E E i = A E E i / P i × 100 %
式中: A E E ii区县农业人口估计值的绝对估计误差; P E i为农业人口格网数据还原到区县尺度时i区县农业人口的估计值; P i为人口普查数据中i区县农业人口的统计值; R E E ii区县农业人口估计值的相对估计误差。设定相对估计误差的临界值为: R E E i≤-10%,表示农业人口规模被严重低估;处于(-10%, -5%]之间为低估;处于(-5%, 5%]为正确估计;处于(5%, 10%]为高估; R E E i>10%为严重高估。
绘制不同权重方案下的相对估计误差空间分布图(图6),发现权重方案1~3被正确估计的行政区占比依次为90.55%、90.16%和89.85%,说明3种权重方案下的农业人口估计值与普查数据有良好的一致性,未因权重方案的差异而出现系统性偏差。被严重低估或严重高估的行政区约占5.00%,主要位于农业人口基数较小的大中型城市主城区,比如南京市鼓楼区、杭州市上城区和重庆市渝中区的农业人口规模分别为0人、10人和20人,虽然计算的绝对估计误差(AEE)不大(分别仅为0.467、6.614和0.923),但较小的农业人口基数显著放大了相对估计误差(REE)。
图6 不同权重方案下相对估计误差的空间分布

Fig. 6 Spatial distributions of relative estimation error under different weight schemes

为进一步评估数据集的可靠性[39-40],计算均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和相关系数(r),其计算公式为:
R M S E = i = 1 n P E i - P i 2 n
M A E = i = 1 n P E i - P i n
M A P E = i = 1 n P E i - P i / P i n × 100 %
RMSE、MAE和MAPE的取值范围为[0, +∞),越接近0,说明拟合的准确性越高;r的取值范围为[0,1],越接近1,说明估计精度越高。结果显示(表5),4个评价指标都有良好的表现,RMSE和MAE较小,MAPE小于10%,r接近1,说明农业人口格网数据集具有较高的研究精度,且权重方案1的研究精度最高。
表5 不同权重方案下的精度评估

Tab. 5 Accuracy assessment under different weight schemes

权重方案 RMSE MAE MAPE/% r
方案1 55.65 33.71 2.45 0.999
方案2 58.43 35.64 2.69 0.999
方案3 58.30 35.37 2.77 0.999

注:RMSE为均方根误差;MAE为平均绝对误差;MAPE为平均绝对百分比误差;r为相关系数。下同。

3.4.2 格网尺度有效性验证

为验证格网尺度有效性,分别以1 km、10 km和50 km格网尺度绘制中国农业人口分布图(图7)。比较发现,3种格网尺度下的农业人口格网数据集均可反映中国农业人口分布的主要空间规律,但1 km格网具有更强的分布颗粒感和突出的纹理信息。随着格网尺度增大,农业人口格网数据集的空间变异性逐渐减弱,农业人口空间分布的细节信息大量丢失。从密度峰值来看,1 km格网下农业人口密度值最高可达1947.4人·km-2,10 km尺度下为336.5人·km-2,50 km尺度下仅为180.0人·km-2,且农业人口密度值的统计平均数和标准差也随着格网边长增大而下降,进一步说明增大格网边长显著削弱了格网数据集的空间变异性。
图7 格网尺度的有效性验证

Fig. 7 Validity verification of grid scales

绘制不同格网尺度下的相对估计误差空间分布图(图8),发现1 km、10 km和50 km格网下被正确估计的行政区(-5%< R E E i≤5%)占比分别为90.55%、47.24%和13.97%,被严重低估或严重高估的行政区(R E E i≤-10%或 R E E i>10%)占比分别为4.80%、31.32%和73.38%,说明研究精度随着格网尺度增大而显著下降,格网尺度对数据集的精度影响显著。
图8 不同格网尺度下相对估计误差的空间分布

Fig. 8 Spatial distributions of relative estimation error under different grid scales

计算不同格网尺度下的RMSE、MAE、MAPE和r,结果显示(表6),1 km格网尺度下RMSE和MAE数值最低,MAPE小于10%,r最高,而10 km和50 km尺度下的数据集精度显著下降。这表明选择适当的格网尺度是提升农业人口格网数据集精度的关键。
表6 不同格网尺度下的精度评估

Tab. 6 Accuracy assessment under different grid scales

格网尺度/km RMSE MAE MAPE/% r
1 55.65 33.71 2.45 0.999
10 413.15 268.23 21.51 0.997
50 1494.44 983.54 73.52 0.950

4 结论与建议

4.1 结论

(1) 中国农业人口分布具有明显的空间异质性特征,胡焕庸线是中国农业人口分布的重要分界线。农业人口密度以胡焕庸线为界,呈现出明显的东高西低特征。胡焕庸线东南半壁水田和旱地资源丰富,分布了全国92.22%的农业人口;西北半壁耕地资源较少且水热条件相对较差,农业人口占比约为7.78%。
(2) 平均海拔对中国农业人口分布具有重要影响,导致农业人口密度依地势三级阶梯下降而逐级递增。在同一地势阶梯内,农业人口密度主要受到地形地貌和气温降水的影响,表现为平原和盆地上农业人口密度较大,山地和丘陵上农业人口分布稀疏;平均气温较高且水资源丰富的地区农业人口密度较大,寒冷干旱地区农业人口分布稀疏。
(3) 在自然地理、经济社会和区位因素的影响下,我国各个农业区的农业人口分异显著。农业人口密度较高的农业区有黄淮平原区和京津冀鲁平原丘陵区,密度较低的农业区有东北山地丘陵区、内蒙古高原区、甘新沙漠高原区和青藏高原区。工业化和城镇化进程导致各级城市主城区的农业人口密度较低。

4.2 建议

(1) 胡焕庸线西侧生态环境脆弱,耕地和农业人口较少,可在有条件的地区兴建水利设施,治理沙漠、沼泽等难利用土地,同时增强生态功能,因地制宜推动农旅融合发展。胡焕庸线东侧耕地资源丰富,农业人口密度较高,可加快推进农业数智化进程,发展农业社会化服务,支持小农户融入现代农业合作体系。
(2) 中国地势一级阶梯生态环境脆弱,农业人口密度极低,应以生态保护为主,发展特色生态农业,推动农旅融合。地势二级阶梯上的农业资源禀赋较好,农业人口密度较高,可在有条件的地区加快土壤改良和农田改造,发展智慧农业,提升农业机械化水平。地势三级阶梯上的农业耕作条件最好,农业人口密度最高,可率先推进高标准农田建设,推动一二三产业融合发展。
(3) 中国各个农业区的农业资源禀赋差异较大,建议对不同农业区制定差异化和灵活的农业政策,因地制宜推动农业数智化,研发适应各个农业区不同地形和气候条件的数字化新农具,培训农业人口的数字素养,培育新型职业农民,重点推进黄淮平原区和京津冀鲁平原丘陵区等农业区的农业数字化转型。
[1]
胡焕庸, 张善余. 中国人口地理(上册)[M]. 上海: 华东师范大学出版社, 1984.

[Hu Huanyong, Zhang Shanyu. Population geography of China (first volume)[M]. Shanghai: East China Normal University Press, 1984. ]

[2]
王克冬, 曾维忠, 武佩佩. 以新质生产力引领农业农村现代化——内在逻辑、机遇挑战与实现路径[J]. 四川农业大学学报, 2024, 42(6): 1159-1164, 1178.

[Wang Kedong, Zeng Weizhong, Wu Peipei. Leading agricultural and rural modernization with new quality productivity: Intrinsic logic, opportunities and challenges, implementation pathways[J]. Journal of Sichuan Agricultural University, 2024, 42(6): 1159-1164, 1178. ]

[3]
戴蓉, 郭泺, 薛达元, 等. 中国农业人口分布格局的时空变化特征[J]. 中国人口·资源与环境, 2010, 20(增刊2): 186-189.

[Dai Rong, Guo Luo, Xue Dayuan, et al. Spatio-temporal characteristics of agricultural population spatial distribution in China[J]. Journal of China Population, Resources and Environment, 2010, 20(Suppl. 2): 186-189. ]

[4]
陈阳. 县域尺度下农业人口分布特征及驱动因素初探——以四川省为例[C]// 中国城市规划学会, 重庆市人民政府. 活力城乡美好人居——2019中国城市规划年会论文集(18乡村规划). 北京: 中国建筑工业出版社, 2019: 11.

[Chen Yang. A preliminary study on the distribution characteristics and driving factors of agricultural population at the county scale: A case study of Sichuan Province[C]// China Urban Planning Society, Chongqing Municipal People’s Government. Vibrant Urban and Rural Areas, Beautiful Living:Proceedings of the 2019 China Urban Planning Annual Conference (18 Rural Planning). Beijing: China Architecture & Building Press, 2019: 11. ]

[5]
王海涛, 吴通宜, 白正兵, 等. 陕西省农业人口空间分布与时空演变特征研究[J]. 地理空间信息, 2020, 18(10): 106-109, 6.

[Wang Haitao, Wu Tongyi, Bai Zhengbing, et al. Research on spatial distribution and spatio-temporal evolution characteristics of agricultural population in Shaanxi Province[J]. Geospatial Information, 2020, 18(10): 106-109, 6. ]

[6]
杨燕新, 曹毅, 王文斌. 晋中市农业人口分布的分形研究[J]. 山西农业大学学报(自然科学版), 2011, 31(6): 573-576.

[Yang Yanxin, Cao Yi, Wang Wenbin. The fractal study of agricultural population distribution in Jinzhong City[J]. Journal of Shanxi Agricultural University (Natural Science Edition), 2011, 31(6): 573-576. ]

[7]
米瑞华, 刘书敏, 倪世龙. 陕西省农业人口格网分布特征及其时空演变[J]. 陕西师范大学学报(自然科学版), 2025, 53(2): 37-47.

[Mi Ruihua, Liu Shumin, Ni Shilong. Research on the grid distribution characteristics and spatiotemporal evolution of agricultural population in Shaanxi Province[J]. Journal of Shaanxi Normal University (Natural Science Edition), 2025, 53(2): 37-47. ]

[8]
张慧泽, 高启杰. 新农人现象与乡村人才振兴机制构建——基于社会与产业双重网络视角[J]. 现代经济探讨, 2021(2): 121-125.

[Zhang Huize, Gao Qijie. The phenomenon of new farmers and the construction of vitalizing mechanism of rural talents: Based on the perspective of social and industrial dual network[J]. Modern Economic Research, 2021(2): 121-125. ]

[9]
Javanmard R, Lee J, Kim J, et al. The impacts of the modifiable areal unit problem (MAUP) on social equity analysis of public transit reliability[J]. Journal of Transport Geography, 2023, 106: 103500, doi: 10.1016/j.jtrangeo.2022.103500.

[10]
Mei Y, Gui Z, Wu J, et al. Population spatialization with pixel-level attribute grading by considering scale mismatch issue in regression modeling[J]. Geo-spatial Information Science, 2022, 25(3): 365-382.

[11]
刘彦随, 张紫雯, 王介勇. 中国农业地域分异与现代农业区划方案[J]. 地理学报, 2018, 73(2): 203-218.

DOI

[Liu Yansui, Zhang Ziwen, Wang Jieyong. Regional differentiation and comprehensive regionalization scheme of modern agriculture in China[J]. Acta Geographica Sinica, 2018, 73(2): 203-218. ]

DOI

[12]
徐新良, 刘纪远, 张树文, 等. 中国多时期土地利用遥感监测数据集(CNLUCC)[DB/OL]. [2018]. 资源环境科学数据注册与出版系统(http://www.resdc.cn/

[Xu Xinliang, Liu Jiyuan, Zhang Shuwen, et al. China multi-period land use remote sensing monitoring dataset (CNLUCC)[DB/OL]. [2018]. Resource and Environmental Science Data Registration and Publication System (http://www.resdc.cn/

[13]
蒋捷, 杨昕. 基于DEM中国地势三大阶梯定量划分[J]. 地理信息世界, 2009, 7(1): 8-13.

[Jiang Jie, Yang Xin. Quantitative segmentation of the three gradient terrain of China based on EDM[J]. Journal of Spatio-temporal Information, 2009, 7(1): 8-13. ]

[14]
米瑞华, 杨昕, 冯飞. 城市开发区人口分布预测及其规划价值——以西安市高新区为例[J]. 西北大学学报(自然科学版), 2019, 49(5): 801-807.

[Mi Ruihua, Yang Xin, Feng Fei. Population distribution projection in urban evelopment zones and its planning value: Taking Xi’an high-tech zone as an example[J]. Journal of Northwest University (Natural Science Edition), 2019, 49(5): 801-807. ]

[15]
郑川, 贾召亮, 许瑞杰, 等. 基于风险普查建筑物隐患数据和夜间灯光数据的云南省盈江县人口分布精细化研究[J]. 地震研究, 2023, 46(3): 403-414.

[Zheng Chuan, Jia Zhaoliang, Xu Ruijie, et al. Refinement study of population distribution in Yingjiang County based on hidden danger data and nighttime lighting data of risk census[J]. Journal of Seismological Research, 2023, 46(3): 403-414. ]

[16]
淳锦, 张新长, 黄健锋, 等. 基于POI数据的人口分布格网化方法研究[J]. 地理与地理信息科学, 2018, 34(4): 83-89, 124, 2.

[Chun Jin, Zhang Xinchang, Huang Jianfeng, et al. A gridding method of redistributing population based on POIs[J]. Geography and Geo-information Science, 2018, 34(4): 83-89, 124, 2. ]

[17]
Yang X C, Ye T T, Zhao N Z, et al. Population mapping with multisensor remote sensing images and point-of-interest data[J]. Remote Sensing, 2019, 11(5): 574, doi: 10.3390/rs11050574.

[18]
李姗姗, 林文坛. 基于夜光遥感的粤港澳大湾区人口空间分布及特征研究[J]. 热带地理, 2023, 43(3): 384-394.

DOI

[Li Shanshan, Lin Wentan. Spatial distribution and characteristics of population in the Guangdong-Hong Kong Macao Greater Bay Area based on night-light remote sensing[J]. Tropical Geography, 2023, 43(3): 384-394. ]

DOI

[19]
桂志鹏, 梅宇翱, 吴华意, 等. 顾及POI人口吸引力异质性的城市人口空间化方法[J]. 地球信息科学学报, 2022, 24(10): 1883-1897.

DOI

[Gui Zhipeng, Mei Yu’ao, Wu Huayi, et al. Urban population spatialization by considering the heterogeneity on local resident attraction force of POIs[J]. Journal of Geo-information Science, 2022, 24(10): 1883-1897. ]

[20]
李慧敏, 罗大伟, 窦世卿. 利用腾讯位置大数据进行多尺度人口空间化估算[J]. 测绘通报, 2022(6): 93-97.

DOI

[Li Huimin, Luo Dawei, Dou Shiqing. The estimation of population on multi-spatial scale using Tencent location big data[J]. Bulletin of Surveying and Mapping, 2022(6): 93-97. ]

DOI

[21]
Yu B, Lian T, Huang Y, et al. Integration of nighttime light remote sensing images and taxi GPS tracking data for population surface enhancement[J]. International Journal of Geographical Information Science, 2019, 33(4): 687-706.

[22]
张学珍, 王发浩, 路伟东, 等. 1776—1953年中国传统农区人口的格网化重建[J]. 中国科学: 地球科学, 2022, 52(3): 528-539.

[Zhang Xuezhen, Wang Fahao, Lu Weidong, et al. Grid reconstruction of Chinese traditional agricultural area population from 1776 to 1953[J]. Scientia Sinica (Terrae), 2022, 52(3): 528-539. ]

[23]
Han D R, Yang X H, Cai H Y, et al. Modelling spatial distribution of fine-scale populations based on residential properties[J]. International Journal of Remote Sensing, 2019, 40(14): 5287-5300.

[24]
吴京航, 桂志鹏, 申力, 等. 顾及格网属性分级与空间关联的人口空间化方法[J]. 武汉大学学报(信息科学版), 2022, 47(9): 1364-1375.

[Wu Jinghang, Gui Zhipeng, Shen Li, et al. Population spatialization by considering pixel-level attribution grading and spatial association[J]. Geomatics and Information Science of Wuhan University, 2022, 47(9): 1364-1375. ]

[25]
Wang F, Lu W, Zheng J, et al. Spatially explicit mapping of historical population density with random forest regression: A case study of Gansu Province, China, in 1820 and 2000[J]. Sustainability, 2020, 12(3): 1231, doi: 10.3390/su12031231.

[26]
Wang L Y, Fan H, Wang Y K. Fine-resolution population mapping from international space station nighttime photography and multisource social sensing data based on similarity matching[J]. Remote Sensing, 2019, 11(16): 1900, doi: 10.3390/rs11161900.

[27]
Ye T, Zhao N, Yang X, et al. Improved population mapping for China using remotely sensed and points-of-interest data within a random forests model[J]. Science of the Total Environment, 2019, 658: 936-946.

[28]
Wang L, Fan H, Wang Y. Improving population mapping using Luojia 1-01 nighttime light image and location-based social media data[J]. Science of the Total Environment, 2020, 730: 139148, doi: 10.1016/j.scitotenv.2020.139148.

[29]
Sinha P, Gaughan A E, Stevens F R, et al. Assessing the spatial sensitivity of a random forest model: Application in gridded population modeling[J]. Computers, Environment and Urban Systems, 2019, 75: 132-145.

[30]
罗永臻, 董春, 张玉. 人口空间化适宜格网评价方法研究[J]. 地球信息科学学报, 2023, 25(5): 896-908.

DOI

[Luo Yongzhen, Dong Chun, Zhang Yu. Study on the method of evaluating the suitable grid for population spatialization[J]. Journal of Geo-information Science, 2023, 25(5): 896-908. ]

[31]
董南, 杨小唤, 蔡红艳, 等. 人口密度格网尺度适宜性评价方法研究——以宣州区乡村区域为例[J]. 地理学报, 2017, 72(12): 2310-2324.

DOI

[Dong Nan, Yang Xiaohuan, Cai Hongyan, et al. Suitability evaluation of gridded population distribution: A case study in rural area of Xuanzhou district, China[J]. Acta Geographica Sinica, 2017, 72(12): 2310-2324. ]

DOI

[32]
Fang Y, Jawitz J W. High-resolution reconstruction of the United States human population distribution, 1790 to 2010[J]. Scientific Data, 2018, 5: 180067, doi: 10.1038/sdata.2018.92.

[33]
王明明, 王卷乐. 山东省街道/乡镇级格网化人口空间分布数据集(2000、2010年)[J]. 中国科学数据 2019, 4(3): 182-192.

[Wang Mingming, Wang Juanle. Gridded data of township-level population distribution in Shandong Province (2000 & 2010)[J]. China Scientific Data, 2019, 4(3): 182-192. ]

[34]
米瑞华, 石英. 基于常住人口分布的城市主副中心识别方法——以西安市为例[J]. 陕西师范大学学报(自然科学版), 2014, 42(3): 97-102.

[Mi Ruihua, Shi Ying. Identifying method of CBD and sub-CBD based on the distribution of resident population: A case study of Xi’an City[J]. Journal of Shaanxi Normal University (Natural Science Edition), 2014, 42(3): 97-102. ]

[35]
郭子翰, 陈斐, 刘晓丽, 等. 基于土地利用类型提高人口格网数据空间精度的方法[J]. 测绘通报, 2021(12): 66-70.

DOI

[Guo Zihan, Chen Fei, Liu Xiaoli, et al. A method to improve the spatial accuracy of population grided data based on land use[J]. Bulletin of Surveying and Mapping, 2021(12): 66-70. ]

DOI

[36]
周祖根, 王静龙. 人口密度的等值线图应用研究[J]. 中国人口科学, 1992(5): 28-33.

[Zhou Zugen, Wang Jinglong. Application research on contour map of population density[J]. Chinese Journal of Population Science, 1992(5): 28-33. ]

[37]
伍理. 介绍新编“1/(600万)”中国人口分布图和等值线密度图[J]. 人口研究, 1987(4): 59-60, 58.

[Wu Li. Introduction to the newly compiled “1/(6 million)” China population distribution map and contour density map[J]. Population Research, 1987(4): 59-60, 58. ]

[38]
Leyk S, Gaughan A E, Adamo S B, et al. The spatial allocation of population: A review of large-scale gridded population data products and their fitness for use[J]. Earth System Science Data, 2019, 11(3): 1385-1409.

[39]
肖东升, 王宁, 刘志成. 干旱地区“代表性人口格网数据集”精度研究——以甘宁青地区为例[J]. 干旱区地理, 2023, 46(3): 505-514.

DOI

[Xiao Dongsheng, Wang Ning, Liu Zhicheng. Accuracy of “Representative population grid dataset” in arid areas: A case of Gansu-Ningxia-Qinghai region[J]. Arid Land Geography, 2023, 46(3): 505-514. ]

DOI

[40]
Bai Z Q, Wang J L, Wang M M, et al. Accuracy assessment of multi-source gridded population distribution datasets in China[J]. Sustainability, 2018, 10(5): 1363, doi: 10.3390/su10051363.

文章导航

/