Special: Application of Artificial Intelligence in Landscape Architecture

Dynamic Perception and Vitality Assessment of Crowds in Urban Parks Based on an Enhanced YOLO Object Detection Model: A Case Study of Xi’an Xingfu Forest Belt

  • YAN Mingyu ,
  • WANG Fei , *
Expand
  • School of Human Settlements and Civil Engineering, Xi’an Jiaotong University

YAN Mingyu is a master student in the School of Human Settlements and Civil Engineering, Xi’an Jiaotong University. His research focuses on urban and rural ecological planning and design, and vernacular architectural heritage protection

WANG Fei, Ph.D., is an associate professor and master supervisor in the School of Human Settlements and Civil Engineering, Xi’an Jiaotong University. His research focuses on urban and rural ecological planning and design, and vernacular architectural heritage protection

Received date: 2025-08-09

  Revised date: 2025-10-28

  Online published: 2025-12-26

Copyright

Copyright © 2025 Landscape Architecture. All rights reserved.

Abstract

[Objective] Urban parks play a vital role in enhancing residents’ physical and mental well-being and offering leisure opportunities. Their vitality has become a crucial indicator of urban spatial quality and public welfare. Rapid urbanization has further intensified the imbalance in the allocation of public service resources. Existing research, which primarily relies on heat maps, mobile signaling data, or ground-based camera monitoring, can reveal macroscopic trends but fail to capture the dynamic spatiotemporal characteristics of crowd distribution at the micro scale. Meanwhile, aerial photography obtained through unmanned aerial vehicle (UAV) offers high spatial resolution and flexible data acquisition capabilities, while the advancement of object detection algorithms based on deep learning presents new technological opportunities for crowd recognition in complex urban environments. This research aims to develop and validate a micro-scale vitality measurement method for urban parks based on aerial time-series imagery and an improved object detection model. The method seeks to reveal the spatiotemporal patterns of crowd distribution, identify high-frequency vitality nodes and their driving mechanisms, and provide data support and strategic insights for optimizing the spatial layout, facility allocation, and refined management of parks. Taking Xi’an Xingfu Linear Park as an example, the research focuses on analyzing vitality intensity, fluctuation, and spatial balance at a fine spatiotemporal scale.
[Methods] Between March 27 and 30, 2025, continuous UAV-based aerial photography was conducted at a fixed altitude of 75 m during six standard time periods (08:00, 10:00, 12:00, 14:00, 16:00, 18:00), yielding over 2,300 high-resolution images. A manually annotated dataset of 2,000 sub-images with 12,340 pedestrian instances is constructed for model training. To address challenges of small-scale targets and complex occlusions in aerial imagery, an enhanced YOLO11m-CBAM model is developed by embedding a convolutional block attention module (CBAM) into YOLO11m. The improved model achieves notable performance gains: mAP50 increases from 77.1% to 81.3%, mAP50–95 from 45.6% to 51.7%, with precision and recall reaching 86.4% and 72.0% respectively, demonstrating enhanced robustness under medium and low occlusion conditions. Detection outputs are orthorectified to geographic coordinates to construct a structured spatiotemporal dataset. Spatial analysis employs kernel density estimation, coefficient of variation (CV), spatial Gini coefficient, and the “latitude-population” curve to characterize multidimensional vitality patterns.
[Results] The temporal analysis results indicate that the overall utilization of Xingfu Forest Belt exhibits a distinct “dual-peak” pattern. On rest days, the number of visitors reaches 2,112 at 10:00 and 3,641 at 16:00, reflecting typical peaks of family and leisure activities. The daily coefficient of variation (CV = 38.67%) is relatively low, suggesting stable visiting patterns with activity concentrated in leisure hours. In contrast, on working days, vitality peaks occur at 10:00 and 18:00, corresponding to post-commuting and after-work relaxation periods, respectively. The higher daily visiting (CV = 55.34%) indicates a more uneven temporal distribution of activities. Notably, 12:00 represents the lowest point of visiting (the minimum number of visitors is only 595, and the average number is 883), implying underutilization of space during midday and suggesting potential opportunities for future facility optimization or time-specific programming. The spatial equilibrium analysis further reveals that during peak hours (14:00 and 16:00), the spatial Gini coefficient reaches 0.44 – 0.48, indicating a strong concentration of vitality in specific functional zones and a pronounced spatial polarization effect. In contrast, the Gini coefficient drops to 0.24 during off-peak periods (08:00 and 12:00), reflecting a more dispersed and evenly distributed use of space. At 18:00, the Gini coefficient remains between 0.38 and 0.41, suggesting a moderate level of aggregation in the evening. Overall, the vitality of Xingfu Forest Belt demonstrates a dynamic pattern of “daytime polarization with evening recovery”. In terms of spatial distribution, vitality hotspots are primarily concentrated along the central and northern segments of the belt, forming localized peaks. The emergence of these core areas is driven by two main factors: 1) the attraction of fixed functional facilities such as children’s play areas, fitness zones, and square-dancing spaces; and 2) the temporal aggregation generated by periodic activities, including weekend family events and morning exercise. At the macro scale, the concentration of residential and educational land uses, high accessibility to bus stops, and the scarcity of comparable recreational facilities jointly reinforce the sustained vitality of the central children’s play area. Maintaining consistently high footfall and strong spatial spillover effects across multiple time periods, this area serves as a key vitality hub within the overall spatial structure of Xingfu Forest Belt.
[Conclusion] The research demonstrates that the proposed UAV-based and YOLO-based vitality measurement framework provides high spatiotemporal resolution at the micro-park scale, enabling accurate identification of vitality hotspots, temporal fluctuations, and spatial imbalances. This approach offers an operational, quantitative basis for optimizing facility layouts, designing flexible spaces, and implementing differentiated management strategies. Methodological limitations are also discussed: The approach performs reliably in spring, autumn, and winter with low to moderate vegetation coverage, but may encounter partial omissions under dense canopy or multi-layer pergola structures in summer. To enhance applicability, future improvements include multi-drone and multi-view data acquisition, infrared thermal imaging to mitigate occlusion, air-ground data fusion, inter-frame trajectory matching to distinguish stay/pass behaviors, and fine-grained activity recognition. Overall, the proposed method provides a replicable technical pathway and empirical reference for refined park governance and smart park development. The findings contribute to advancing quantitative urban vitality assessment and provide methodological insights for integrating AI and spatial analysis in urban landscape research.

Cite this article

YAN Mingyu , WANG Fei . Dynamic Perception and Vitality Assessment of Crowds in Urban Parks Based on an Enhanced YOLO Object Detection Model: A Case Study of Xi’an Xingfu Forest Belt[J]. Landscape Architecture, 2025 , 32(12) : 45 -55 . DOI: 10.3724/j.fjyl.LA20250482

城市公园是居民身心健康保障与休闲游憩的核心载体,并承担着重要的城市生态系统服务功能[1]。然而,快速城市化进程加剧了公共服务资源配置的不均衡[2-3]。当前城市规划中,公园在数量、规模与布局上的配置主要依据人均指标(千人指标)以及多层级生活圈(5、10、15 min)服务半径等标准[4],这些宏观尺度指标对微观尺度下公园内部空间的实际使用效能反映有限。现有研究也多聚焦于城市尺度公共空间的宏观格局分析,对公园尺度下公共空间的人群分布特征及活力时空动态的精细化研究仍显不足。因此,亟须发展能够精准测度公园内部人群分布与活力时空格局的方法,这对于提升绿地利用效率、优化资源配置、保障服务公平性具有重要的理论价值与实践意义。
随着城市内部空间结构复杂化与居民活动频率持续提升,人群时空分布特征已成为城市空间优化与更新的关键依据[5]。宏观尺度的人群时空分布研究表明,城市流动空间中的人群分布呈现显著时空异质性[6],相关成果广泛应用于功能区划、交通组织等实践领域;中观尺度的人群时空分析指出,动态人口密度与公共服务设施分布存在强相关性[7],而与常住人口规模关联性较弱。然而,当聚焦于城市公园这一重要微观空间单元时,现有公园人群时空分布相关研究存在显著局限:1)多关注节假日、季节等客观因素对公园整体使用模式的影响[8],对主观性事件(如聚集性活动、疫情防控政策[9])等突发约束下的动态变化关注不足;2)往往将公园视为均质整体,对内部不同区域的活力差异及其结构性成因缺乏深入解析;3)现行GB/T 51346—2019《城市绿地规划标准》主要依据服务人口规模评估城市绿地布局合理性[10],这种静态、宏观的视角难以捕捉微观动态,易导致公园内部服务负荷失衡和空间资源利用低效。因此,以公园内部微观空间为对象,结合新型数据采集技术,量化分析人群时空分布动态,可为识别城市绿地资源配置中的结构性矛盾、提升公园空间效能与公共服务公平性提供更具针对性的支撑。
Jacobs率先将“活力”的概念引入城市空间领域[11],该概念的本质是人群及其活动的聚集性表现[12],是评估公园等公共空间吸引力与资源配置效率的关键指标。近年来,伴随着大数据与人工智能技术的发展,活力测度研究在研究对象与评价维度上日益多元化[13-15]。研究对象涵盖了综合性城市公园[16]、郊野公园[17]、滨水公园[18]等类型;评价维度则包括了空间聚集性、时间持续性、活动多样性与反馈积极性等[19]。然而,现有研究多以公园整体为分析单元,偏重宏观尺度上不同地区公园间的活力比较,对公园内部空间活力差异的识别及结构性成因的理解相对不足。事实上,探索公园内部活力的时空异质性、节点差异与空间活力演化趋势,对于精准优化公园空间布局与提升公园服务效率至关重要。在测度方法上,城市活力相关研究虽逐步由静态指标的测度转向动态趋势的分析,强调活力的强度和稳定性双重维度[20],但主流的传统宏观测度技术方法(如手机信令、热力图)存在3个方面的局限:1)受限于技术原理(如基站定位误差)和隐私保护要求,手机信令以及互联网平台的定位精度通常在数十米至百米级,难以获取人群个体的精确位置;2)定位数据高度依赖特定电信运营商或互联网平台,单一运营商或平台仅能覆盖自身用户群体,无法代表公园内全部活动人群;3)运营商或平台的定位数据获取门槛高、开放度低、更新频率不可控等问题进一步加剧了应用难度。这些缺陷导致传统技术方法难以满足公园内部微观活力测度需求,一定程度上制约了针对公园微观尺度的精准施策。
近年来,遥感与人工智能技术的突破性进展,为城市公园内人群动态与空间活力的监测开辟了新路径[21]。传统地面观测手段如固定点位的视频监控与流动的人工巡查,存在难以覆盖全公园、安装成本高、视角固定等问题,难以灵活捕捉公园内部不同区域的人群动态变化。相比之下,无人机航拍凭借灵活的机动性、大范围覆盖性,为公园内部微观尺度的大范围、高精度人群分布识别提供了理想设备。
传统人工计数、问卷调查等方法在效率、时效性及精度方面存在不足[22],相比之下,计算机视觉技术,特别是深度学习驱动的目标检测算法,正推动人群动态监测领域的根本性变革。早期人群动态监测方法(如前景分割技术)通过背景建模和像素差异提取目标,但对光照变化、视野遮挡和视角变化高度敏感,难以满足复杂公园环境下的精准识别需求[23]。随着卷积神经网络(convolutional neural network, CNN)的发展,基于区域提议的检测方法,如区域卷积神经网络(region-based convolutional neural network, R-CNN)系列算法虽提升了精度,但在提升处理速度和降低模型复杂度上仍存在瓶颈。YOLO(you only look once)算法通过端到端的回归框架,仅需单次前向传播即可同时输出目标位置与类别,在平衡检测效率与精度方面实现了突破。经过持续迭代优化,YOLO算法的网络结构、特征提取与多尺度检测能力显著增强,适用于城市公园这类背景复杂、人群密集且动态变化频繁的微观开放空间场景。凭借高效实时的性能优势,YOLO算法被广泛应用于人群动态监测,为量化和解析城市公园时空活力提供了可靠的技术基础[24]
基于上述研究缺口与技术机遇,本研究以西安幸福林带为例,提出“YOLO-航拍时序影像”方法,实现对城市公园内部人群分布与活力时空格局的高精度、动态化测度。具体研究目标包括:1)识别公园内部人群分布模式,揭示活力强度的时间演化规律及空间聚集特征;2)解析公园内部活力峰值形成的空间环境成因,评估关键区域活力的时间稳定性与波动性特征;3)基于微观活力时空格局的精细化解析,探讨优化公园空间布局、提升设施配置效率、促进服务公平性的差异化策略。本研究旨在为提升城市公园服务效能与空间利用率提供理论支持与实践参考。

1 研究对象与方法

1.1 研究对象

本研究选取西安市中心城区的幸福林带(简称幸福林带)作为研究对象。作为全国最大的城市林带工程和西安市重点市政、生态和民生工程,幸福林带呈线状分布(全长约5.85 km,平均宽度约200 m,总用地面积1.17 km2[25],融合了休闲游憩、生态防护与景观营造等复合功能,其公共使用属性与开放空间特征符合城市公园的基本范畴,属于具有线性布局特征的城市公园。幸福林带涵盖多样的景观节点、绿地空间及公共设施,具有复杂的空间结构,成为研究城市公园活力时空异质性的典型样本。幸福林带作为城市线性开放空间(图1),其带状形态导致人群分布及活动模式呈现显著时空异质性。不同地段人群分布分化明显,且工作日与周末人群密度波动较大。深入研究其人群时空分布规律,对满足市民日常休闲需求、提升设施配置效率、增强公园活力具有重要意义。
图1 西安幸福林带

Fig. 1 Xi’an Xingfu Forest Belt

1.2 研究方法

1.2.1 技术路线

本研究构建了“数据采集—数据处理—目标识别—坐标映射—空间分析”的人群动态感知与活力测度技术路线(图2),具体如下。1)数据采集:通过无人机获取航拍时序影像;2)数据处理:将获取的航拍时序影像裁切处理为适合模型检测的尺寸;3)目标识别:利用YOLO11m-CBAM模型检测航拍图像中的行人目标;4)坐标映射:通过正射投影变换将检测目标从像素坐标转换为地理坐标,并进行精度校验;5)空间分析:生成热力图与活力指标,开展多维度公园活力评估。
图2 技术路线

Fig. 2 Technical route

1.2.2 数据采集

本研究采用无人机采集数据,通过固定航高(75 m)的预设航线对幸福林带实施连续覆盖式航拍时序影像采集。数据采集时间为2025年3月27—30日的2个工作日和2个休息日。每日于6个固定时刻(08:00、10:00、12:00、14:00、16:00、18:00) 开展标准化拍摄,统一控制全程飞行参数(飞行速度、拍摄角度等)来排除系统偏差,保障数据的随机性与客观性。通过连续4 d相同时刻的重复观测,进行多日期数据的交叉验证,增强人群活动模式分析的稳定性。本研究成功获取2300余张高分辨率航拍影像,以此构建兼具时间连续性与空间完整性的数据集,用于后续公园内部人群识别与活力分析。
需要说明的是,虽然航拍影像数据质量受环境(如夏季植被茂盛或多廊架结构的区域)遮挡影响,但幸福林带为2021年建成区域,树木树龄短、冠层遮挡程度低,且本研究航拍影像数据采集于春季,树木冠层对人群的遮挡效应有限。此外,幸福林带行人活动高度集中于路径系统与广场区域,极少进入绿化区域内部。上述条件共同保障数据的有效性,能够满足活力测度的需求。

1.2.3 影像处理与模型训练

本研究以YOLO11m为基础模型,针对无人机航拍影像中行人目标尺度小、背景复杂、遮挡频繁等挑战,提出了融合注意力机制的改进模型YOLO11m-CBAM。注意力机制是一种能让模型聚焦关键目标信息、抑制无关背景干扰的深度学习模块,能够自动调整模型中不同信息的重要性,具体包括通道注意力和空间注意力2个部分。该改进模型在主干网络的关键特征提取层嵌入卷积块注意力模块( convolutional block attention module, CBAM),通过通道注意力机制增强模型对行人目标特征的响应能力,同时利用空间注意力机制抑制复杂背景(如植被、设施)干扰,从而有效提升小尺度行人目标检测精度。
为支撑模型训练,本研究构建了一个行人目标检测训练数据集,包含2 000张人工标注航拍子图(尺寸为1 024像素×1 024像素)。该数据集通过分层抽样覆盖幸福林带全域空间场景,共标注12 340个行人目标,用于模型训练与精度评估。原始高分辨率影像(8 192像素×6 144像素)经重叠切片处理分割为子图,以适应模型输入尺寸。此处理方式在避免因尺度压缩造成信息损失的同时,有效保留了行人目标的空间连续性。
改进后的YOLO11m-CBAM模型在精度与准确率等主要评估指标上均取得明显提升。具体而言,mAP50指标(衡量预测框与真实框交并比≥50%的平均精度均值)较YOLO11m基础模型提升4.2个百分点(从77.1%提升至81.3%),mAP50-95指标(交并比为50%~95%的平均精度)提升6.1个百分点(从45.6%提升至51.7%)。同时,改进的YOLO11m-CBAM模型的准确率(precision)和召回率(recall)亦显著提升,分别达到86.4%和72.0%。该改进模型有效增强了对小尺度行人目标的检测能力,并显著降低了遮挡场景内的误检率,为公园微观活力的精细化测度提供了可靠技术支持(图3)。
图3 改进前后YOLO模型在遮挡场景的检测效果对比

Fig. 3 Comparison of detection effects of YOLO models before and after improvement in the occlusion scenario

选取幸福林带2类典型遮挡场景,以验证改进模型在复杂场景下的鲁棒性。在格栅结构遮挡与多目标密集分布的场景中,YOLO11m基础模型检测目标的置信度偏低,平均值仅0.55,并存在目标漏检现象。原因是格栅结构的纹理干扰了行人特征的提取,部分目标未被有效识别。针对这一问题,本研究引入注意力机制对模型进行改进。在改进后的YOLO11m-CBAM模型中,通道注意力机制能增强对行人轮廓、姿态等关键特征的提取,空间注意力机制则有效抑制了背景中格栅结构的纹理干扰,实验结果表明平均检测置信度提升至0.87,并能完整捕捉全部行人目标。
在树木枝叶遮挡与小尺度目标的场景中,YOLO11m基础模型因枝叶遮挡和目标尺度较小出现漏检现象,且检测目标的置信度低于0.60。YOLO11m-CBAM模型可准确识别更多被枝叶轻微遮挡的小尺度目标,置信度超过0.90,显著提升了对树木枝叶遮挡与小尺度目标场景的检测能力。
结合西安幸福林带疏林草地为主、设施分散布局的空间特征,YOLO11m-CBAM模型在城市公园、城市广场等开放空间的活力测度中具备一定适配性。若开放空间场景内无大面积密林或复杂多层廊架,该模型即可实现高精度行人识别,有效支撑活力时空分析。

1.2.4 地理坐标转换

本研究以YOLO11m-CBAM模型输出的目标边界框中心点像素坐标($x_{\rm{p}} $$y_{\rm{p}} $)作为基础数据。训练时使用归一化YOLO格式标注数据[类别,$x_{\rm{c}} $$y_{\rm{c}} $$w $$h $],类别即目标类别索引(如0代表“人”),$x_{\rm{c}} $$y_{\rm{c}} $为目标框中心点在原始影像宽度、高度方向的比例,$w $$h $为目标框宽度、高度占原始影像宽、高的比例。检测后需先将归一化坐标还原为原始影像像素尺度,再进行地理坐标映射转换。
通过构建正射投影变换模型实现像素坐标到地理坐标的映射。以读取的无人机影像中心点经纬度(${\text{λ}}_{\rm{c}} $${\text{Φ}}_{\rm{c}}$)为基准,结合影像实际覆盖宽度(145 m)与像素宽度(8 192),计算得到地面分辨率约为0.017 7 m/像素。依据行人中心像素坐标($x_{\rm{p}} $$y_{\rm{p}} $)与影像中心的偏移量,计算出平面坐标差值$ {\text{Δ}}X $$ {\text{Δ}}Y $,再通过经纬度换算公式将其转换为$ {\text{Δ}}{\text{λ}} $${\text{Δ}}{\text{Φ}}$,经纬度增量的计算式
$ {\text{Δ}}{\text{λ}} ={\text{Δ}}X/(111\ 320\times cos{{\text{Φ}} }_{c}), $
$ {\text{Δ}}{\text{Φ}} ={\text{Δ}}Y/110\ 574, $
式中:${\text{Δ}}X $${\text{Δ}}Y $分别为目标点与图像中心点在东西与南北方向的平面实际距离差,m;${\text{Φ}}_{\rm{c}}$为图像中心点的纬度;${\text{Δ}}{\text{λ}} $为经度增量;${\text{Δ}}{\text{Φ}}$为纬度增量;111 320指地球赤道上1经度的距离约为111.32 km;110 574指地球上1纬度的距离约为110.57 km。目标经纬度的计算式
$ {\text{λ}}_{\mathrm{t}}={\text{λ}}_{\mathrm{c}}+{\text{Δ}}{\text{λ}} , $
$ {\text{Φ}}_{\mathrm{t}}={\text{Φ}}_{\mathrm{c}}+{\text{Δ}}{\text{Φ}} , $
式中:${\text{λ}}_{\mathrm{t}} $为目标点经度;${\text{Φ}}_{\rm{t}}$为目标点纬度;${\text{λ}}_{\mathrm{c}} $为影像中心点经度;${\text{Φ}}_{\rm{c}}$为影像中心点纬度;${\text{Δ}}{\text{λ}} $为经度增量;${\text{Δ}}{\text{Φ}}$为纬度增量。
经实测验证,该坐标转换模型的水平定位精度的均方根误差≤1.2 m,表明该模型完全满足微观公园尺度人群活动分析的需求。最终输出的结构化时空数据集包含时间戳、经纬度坐标与目标标识(identifier, ID)序号等关键字段,为GIS空间分析与可视化提供了标准化数据支持。

1.2.5 活力测度与空间分析方法

1.2.5.1 核密度评估与热力图生成

基于行人地理坐标数据,本研究运用核密度估计(kernel density estimation, KDE) 方法生成多时刻热力图。通过对比工作日与休息日、每日不同时间段热力图来识别活力热点与冷点区域,揭示幸福林带人群时空动态模式。

1.2.5.2 多维度活力分析

本研究构建时序波动性、空间聚集强度、空间活力均衡性3类活力分析模型来系统分析公园空间动态特征。1)为量化幸福林带活力的时序波动特征,引入变异系数(coefficient of variation, CV)作为活力时序差异的核心指标,CV值越大活力波动越强。2)沿幸福林带长轴方向绘制“纬度-人数”曲线,识别活力峰值与公园地段、景观节点的耦合关系,揭示不同区段的空间吸引力差异。3)计算活力分布的基尼系数[26],该指标能定量评估人群分布的均衡程度,为资源配置公平性优化提供量化依据。基尼系数越接近1,表明活力分布越集中;基尼系数越接近0,则分布越均衡。4)聚焦活力峰值节点,追踪幸福林带在不同时间的活力变化,识别幸福林带的人群高频使用时间与使用特征,总结典型空间单元的使用规律来支撑精细化运营管理。

2 研究结果与分析

2.1 活力时序变化

本研究基于4 d(休息日为第1天、第2天,工作日为第3天、第4天)6个固定时刻的高精度航拍时序影像数据,统计各个时刻公园到访人数,系统解析了幸福林带整体活力时序演变规律(图4)。
图4 西安幸福林带各时间访客数量变化统计

Fig. 4 Statistics on changes in the number of visitors in Xi’an Xingfu Forest Belt

本研究发现幸福林带全天活力呈现显著的双峰特征,但工作日与休息日存在显著差异。休息日第1天活力高峰集中于10:00(2 116人)和16:00(3 641人),变异系数的值为42.36%,表明休闲活动的时段性集中;而工作日第3天活力高峰集中于10:00(1 520人)与18:00下班时间(2 292人),活力变异系数的值为57.34%,表明全天各时间活力差距较大。
值得注意的是,12:00普遍为全天活力最低的时间(最低访客人数仅599人,平均访客人数为883人),而18:00能维持较高活跃度(最低访客人数为1 840人,平均访客人数为2 357人),反映出居民对傍晚休闲活动的强烈需求。人群分布时序规律为幸福林带的精细化运营管理提供了重要依据,可针对工作日、休息日及不同时间实施差异化的设施开放和服务供给策略。

2.2 活力空间均衡性

为衡量幸福林带在不同时间人群分布的均衡性,本研究基于地理栅格化的行人分布数据,计算了活力分布的空间基尼系数(图5)。
图5 西安幸福林带各时段人群分布空间基尼系数

Fig. 5 Spatial Gini coefficient of crowd distribution across different time periods in Xi’an Xingfu Forest Belt

研究发现,休息日基尼系数均值为0.40,工作日基尼系数均值为0.32,且4 d不同时间的空间基尼系数数值差异较大。其中,休息日(第1天与第2天)14:00和16:00的基尼系数最高,均值分别为0.44和0.48,表明14:00和16:00人群集中于特定区域,形成明显的活力热点。相比之下,工作日(第3天与第4天)12:00和14:00基尼系数相对较低(在第4天的14:00达到最低,为0.24),说明工作日中午和午后人群分布较为分散。总体来看,无论是工作日还是休息日,18:00的基尼系数稳定在0.38~0.41,显示18:00仍存在一定聚集性。
进一步分析表明,休息日14:00、16:00的空间活力集中度显著高于工作日,可能与休闲活动及家庭出行的区域聚集效应相关。而工作日人群分布相对均匀,推测因通勤、事务性活动等导致流动性增强,削弱了空间聚集趋势,表明在访客人数高峰时的空间活力集聚现象显著,但低峰时(如清晨、中午)存在空间利用率不足的问题。需通过空间设计优化提升全时段活力均衡性。针对高峰时的空间过载问题,可以通过弹性空间和路径传导的设计缓解压力。

2.3 活力空间分布

本研究基于YOLO目标检测结果与地理栅格方法构建人群分布热力图(10 m×10 m分辨率),系统分析了幸福林带4 d的6个时刻人群分布特征。研究区域为南北向的带状结构,本研究针对性绘制“纬度-人数”曲线,定量分析人群在南北向轴线方向上的分布特征与时间变迁规律(图6)。
图6 西安幸福林带4 d“纬度-人数”曲线分析图

Fig. 6 Analysis chart of the “Latitude – Number of People” curve for Xi’an Xingfu Forest Belt over a period of 4 days

2.3.1 高活力区域分析

在休息日(第1天与第2天),人群分布在14:00与16:00各出现一个显著峰值,其中14:00峰值的人群分布区域对应儿童游乐区,16:00峰值的人群分布区域对应周末活动区,休息日2 d分布模式高度一致。在工作日(第3天与第4天),整体活力水平下降,但2 d都分别在08:00与18:00出现1次小幅峰值,其中08:00峰值主要来源于晨间广场舞活动,18:00峰值仍集中于儿童游乐区。
高活力区域的形成主要受2类因素影响:1)固定功能设施,如儿童游乐设施、健身器材等,能持续吸引人群聚集;2)时段性活动,如周末活动、晨练等,能在特定时段引发局部活力上升。
活力区域时空分布呈现差异化特征。休息日聚集效应显著,工作日人群分布则相对分散,印证了空间基尼系数的分析结果。
识别出2类典型活力模式:1)一部分区域活力呈现“事件驱动型”波动趋势(如周末活动、广场舞活动等);2)另一部分区域表现出“功能稳态型”特征,如儿童游乐区被长时间高频使用,可作为幸福林带运营维护的重点区域(图7)。
图7 西安幸福林带典型人群聚集模式航拍影像

Fig. 7 Aerial images of typical crowd aggregation patterns in Xi’an Xingfu Forest Belt

2.3.2 宏观驱动因素对活力分布的影响

本研究进一步从宏观尺度解析外部因素(包括用地性质与公交可达性)对活力分布的驱动机制,完善活力格局的形成机理。结合百度地图获取公园周边500 m范围内兴趣面(area of interest, AOI)数据,以及西安市公交站点兴趣点(point of interest, POI)数据,分析周边用地AOI功能属性与公交站点分布(图8)。
图8 西安幸福林带活力的宏观驱动因素分析

Fig. 8 Analysis of macro-level driving factors of vitality in Xi’an Xingfu Forest Belt

幸福林带中段儿童游乐区周边房地产用地(住宅)占比较高,并分布有多处教育培训用地(学校),为该区域提供了稳定的家庭型人流,构成该区域活力持续较高的需求基础。幸福林带北段周边居住用地上的退休中老年人广场舞活动为工作日早高峰的活力来源。
儿童游乐区作为幸福林带持续性高活力节点,其吸引力不仅源于内部设施,也依赖宏观条件支撑:1)周边高居住密度以及学校提供充足家庭型人流;2)3个公交站点(覆盖11条线路)保障交通便利,显著提升了该区域的可达性;3)研究区及周边3 km范围内仅该区域设有含攀爬、滑行类组合装置的综合型儿童游乐设施,其余区域仅配备简易滑梯。此类综合设施的稀缺性放大了幸福林带内儿童游乐区的虹吸效应,进一步巩固了活力优势。
综上,幸福林带的空间活力是“内部吸引力(如儿童游乐设施、广场舞等临时活动)”与“外部宏观条件(用地性质、公交可达性)”协同作用的结果。幸福林带中段及周边区域凭借“居住-教育复合用地+高公交密度”的优势成为活力核心,幸福林带北段及周边区域依托居住用地与公交接驳成为次要活力热点,共同构成了多因素协同驱动的活力分布格局。

2.4 典型区域热力分析

儿童游乐区作为幸福林带中活力最高的典型空间,具有显著的人流聚集特征和持续吸引力。基于此,本研究采用10 m×10 m栅格热力图与跨时对比方法,揭示该区域活力演化的时空异质性特征(图9)。空间热力图直观展示了该区域活力强度(红色深度)随时间变化明显。
图9 西安幸福林带儿童游乐区空间热力图

Fig. 9 Spatial heatmap of children’s play area in Xi’an Xingfu Forest Belt

本研究发现,儿童游乐区在休息日的 14:00、16:00、18:00及工作日的 18:00休闲高峰时间出现显著的人群聚集现象,形成清晰的热力核心。工作日整体活力水平虽有所下降,但在18:00仍出现明显的热力核心,表明该区域对亲子活动的持续吸引力。值得注意的是,在16:00和18:00,儿童游乐区的活力热点区域范围明显扩大,表明该区域不仅吸引核心使用者,还对周边空间产生显著的辐射效应。
儿童游乐区作为持续性活力枢纽,其活力波动与幸福林带整体活力变化趋势保持同步,但表现出更显著的聚集特征和更高的峰值水平。基于人群活力分布特征,建议在儿童游乐区增加弹性空间,增设遮阳设施、休憩座椅及互动装置,以提升环境舒适度与空间承载力;充分发挥儿童游乐区在幸福林带整体活力格局中的核心引领作用,联动周边区域提升空间利用效率。未来可进一步研究儿童活动区空间吸引力形成机制,为类似区域的规划设计提供参考。

3 讨论

3.1 研究价值

本研究构建的“YOLO-航拍时序影像”方法体系为微观尺度下城市公园空间活力评估提供了高时空分辨率、可视化强的数据驱动新范式,也为城市景观研究中人工智能与空间分析的融合,提供了方法层面的启示。相比传统调查或热力图数据,该方法更能精准捕捉并反映真实的人群动态分布特征,具有一定的实践研究价值。研究成果可有效指导座椅、遮阳及儿童娱乐等设施的布局与容量优化,支撑基于活力时空特征的公共活动策划,并通过合理布点调控与设施引导提升空间使用效率。

3.2 研究局限性与改进方向

3.2.1 数据采集的遮挡问题与适用边界

尽管本研究在城市公园活力测度方面做出了有益探索,但仍存在若干局限性,在未来研究中可进一步优化与完善。

3.2.1.1 数据采集中的遮挡问题与活力测度的适配性

数据采集过程中存在的遮挡问题,是影响活力测度适配性的重要因素。本研究以单无人机、每日6个固定时刻进行数据采集的方案受航拍视角与植被遮挡影响,在高遮挡场景存在一定行人漏检现象。需要说明的是,活力测度并不完全依赖逐人精确检出。现有数据统计结果表明,即便存在10%~15%的局部漏检,幸福林带活力双峰时序模式、儿童设施区持续性高活力等核心结论仍稳定可靠,公园活力格局未受显著影响。
从季节特征来看,“YOLO-航拍时序影像”方法在春、秋、冬季因植被稀疏,表现良好;行人主要活动区域多为中低遮挡的场地,YOLO11m-CBAM模型识别精度可满足活力测度需求。而在夏季植被茂盛期,可能导致行人目标漏检率上升。尽管人群核心聚集区与活力高峰仍可识别,为进一步提升精度,可以引入新的技术方法进行优化。

3.2.1.2 高遮挡与夏季场景的活力测度优化途径

针对夏季或高遮挡公园的活力测度需求,未来可从3个方面优化与改进测度方法:1)使用多无人机协同采集,通过多视角影像互补减少遮挡盲区,并可适当降低无人机航高以提升行人细节捕捉能力;2)在光学影像受植被严重遮挡时,可借助红外航拍技术,通过人体热辐射成像穿透植被遮蔽[27];3)融合地面传感器网络与固定摄像头等多源数据,构建空-地协同监测体系,弥补单一航拍数据的不足。

3.2.1.3 基于活力测度目标的方法适用边界界定

基于上述分析,本方法主要适用于温带地区春、秋、冬季,且植被覆盖率中等或较低的城市公园。植被茂密的区域(如森林公园或夏季成熟林地)、多层立体交通与复杂构筑物密集区域中应用效果可能受限。

3.2.2 目标采样的局限

本研究的测度体系以行人数量与分布为核心,尚不能有效区分通行、停留与运动等行为模式,限制了对空间功能的深入解读。未来可从2方面进行技术改进:1)采用短时差双机拍摄,通过行人位移阈值区分静态与动态行为;2)引入视频轨迹分析技术,通过跨帧匹配方法分析行人轨迹,提高行为识别精度。上述方法将有助于进一步丰富活力测度维度,提升对空间活力在行为层面的解析深度。
尽管采用固定时刻采样和标准化设计降低了系统偏差,但瞬时采样仍可能出现随机性偏差。本研究通过3种方式予以补偿,即基于人群活动规律选取代表性时间,采用客观固定抽样规则,以及通过连续2 d观测验证活力模式的统计稳定性。结果表明,随机性偏差对整体活力测度结论的影响较小。
在技术选型上,视频采样虽有助于捕捉人群动态,但需权衡分辨率与识别精度。本研究采用的航拍照片分辨率达8 192×6 144像素,能够清晰识别小尺度行人;而视频分辨率通常为1 920×1 080像素,可能出现漏检情况。因此,当前照片采样方案更符合本研究需求。若未来资源允许,可采用多机协同降高视频拍摄方法以进一步提升数据质量。

4 结论

本研究创新性地融合无人机航拍、目标检测与空间分析方法,构建了城市公园活力时空测度的技术框架,并以西安幸福林带为实证对象,获得4点结论。
1)公园活力呈现显著的时序周期性特征。幸福林带活力水平呈现双峰分布特征,休息日活力峰值分别出现在10:00与16:00,工作日活力峰值集中于10:00和18:00,休息日活力峰值(3 641人)显著高于工作日 (2 292人)。反映出居民休闲活动与通勤节奏对公园使用行为的显著影响。
2)不同时刻空间活力分布差异明显。空间基尼系数分析表明,高峰时(14:00与16:00)活力极化现象明显,基尼系数高达0.48;低谷时(如12:00)分布较为均匀,最低值为0.24。休息日整体活力水平更高,热点聚集现象更显著。
3)人群空间分布存在阶段性峰值与集中现象。通过“纬度-人数”曲线分析发现,特定时刻人群分布呈现明显峰值。高峰时空间活力边界清晰,聚集性强;低谷时则分布均衡、空间覆盖度广。
4)活力驱动机制具有复合性特征。本研究发现2类主要的活力驱动因素:一是固定功能节点(如儿童游乐区、广场舞场地等)的持续吸引力;二是时段性组织活动(如亲子表演、健身活动等)的临时聚集效应,两者共同塑造了公园活力格局。
未来建议从3个维度深化研究。1)在技术融合层面,可整合时空轨迹、停留时长、POI数据等多源信息,构建“时空-行为-功能”三维活力评估框架;2)在分析方法层面,应引入基于深度学习的细粒度行为识别算法(如姿态行为识别与轨迹生成模型等),以提升对人群活动类型与移动模式的辨析能力;3)在应用拓展层面,研究基于空间类型学的模型迁移方案,建立适用于各类城市公共空间活力测度体系。这些研究有助于增强城市公园活力测度方法在智慧公园建设和城市更新中的决策支持效能,推动城市公共空间的精细化治理与品质提升。

图12、8底图源自2025年高德地图(https://ditu.amap.com/searchquery=%E5%B9%B8%E7%A6%8F%E6%9E%97%E5%B8%A6&city=330100&geoobj=120.003041%7C30.236845%7C120.108721%7C30.297695&zoom=14.12);图23、7航拍图像由作者操作无人机拍摄后处理;其余图片由作者绘制。

1、提出基于无人机航拍时序影像的人群动态测度方法,突破传统监测方法的精度局限,填补城市公园活力精细测度的研究缺口。

2、融合改进YOLO模型与地理坐标映射技术,构建高精度时空数据集,实现活力热点识别与动态分析,为城市景观规划与精细化管理提供数据支持。

3、揭示西安幸福林带活力“双峰式”时序规律与空间集聚特征,阐明设施与活动对活力的驱动机制,为设施优化与管理提供依据。

[1]
中华人民共和国住房和城乡建设部.城市绿地分类标准: CJJ/T 85—2017[S].北京: 中国建筑工业出版社, 2018: 2-6.

Ministry of Housing and Urban-Rural Development of the People’s Republic of China. Standard for Classification of Urban Green Space: CJJ/T 85−2017[S]. Beijing: China Architecture & Building Press, 2018: 2-6.

[2]
陶晓丽, 陈明星, 张文忠, 等 城市公园的类型划分及其与功能的关系分析: 以北京市城市公园为例[J]. 地理研究, 2013, 32 10 1964.-1976.

TAO X L, CHEN M X, ZHANG W Z, et al Classification and Its Relationship with the Functional Analysis of Urban Parks: Taking Beijing as an Example[J]. Geographical Research, 2013, 32 10 1964.-1976.

[3]
CHIESURA A The Role of Urban Parks for the Sustainable City[J]. Landscape and Urban Planning, 2004, 68 (1): 129.-138.

DOI

[4]
邵明, 李方正, 李雄 基于多源数据的成渝城市群绿色空间生态系统服务功能供需评价[J]. 风景园林, 2021, 28 (1): 60.-66.

SHAO M, LI F Z, LI X Evaluation of Supply and Demand of Green Space Ecosystem Service Function in Chengdu-Chongqing Urban Agglomeration Based on Multi-source Data[J]. Landscape Architecture, 2021, 28 (1): 60.-66.

[5]
JIA P, QIU Y L, GAUGHAN A E A Fine-Scale Spatial Population Distribution on the High-Resolution Gridded Population Surface and Application in Alachua County, Florida[J]. Applied Geography, 2014, 50: 99.-107.

DOI

[6]
WEI X M, QIAN Y, SUN C H, et al A Survey of Location-Based Social Networks: Problems, Methods, and Future Research Directions[J]. GeoInformatica, 2022, 26 (1): 159.-199.

DOI

[7]
任亚鹏, 刘启明, 刘馨, 等 30分钟社区生活圈视角下的武汉市主城区绿色空间公平性评价[J]. 风景园林, 2024, 31 11 94.-102.

DOI

REN Y P, LIU Q M, LIU X, et al Equity Evaluation of Green Space in the Central Urban Area of Wuhan from the Perspective of 30-Minute Community Life Circle[J]. Landscape Architecture, 2024, 31 11 94.-102.

DOI

[8]
赵晓龙, 徐靖然, 刘笑冰, 等 基于无人机(UAV)观测的寒地城市公园冬季体力活动及空间分布研究: 以哈尔滨四个公园为例[J]. 中国园林, 2019, 35 12 40.-45.

ZHAO X L, XU J R, LIU X B, et al Observations of Winter Physical Activities in Urban Parks Using UAVs: A Case Study of Four City Parks in Harbin[J]. Chinese Landscape Architecture, 2019, 35 12 40.-45.

[9]
ZHAO K X, ZHANG S B, LI E L, et al Research on the Evolution of Population Distribution and Influencing Factors in Xi’an During the COVID-19 Epidemic Control Period: Based on a Perspective of Multi-source Spatio-temporal Big Data[J]. IOP Conference Series: Earth and Environmental Science, 2021, 769 (2): 022066.

DOI

[10]
中华人民共和国住房和城乡建设部.城市绿地规划标准: GB/T 51346—2019[S].北京: 中国建筑工业出版社, 2019.

Ministry of Housing and Urban-Rural Development of the People’s Republic of China. Standard for Urban Green Space Planning: GB/T 51346−2019[S]. Beijing: China Architecture & Building Press, 2019.

[11]
JACOBS J. The Death and Life of Great American Cities[M]. Chichester: John Wiley & Sons, Ltd., 2015: 94-109.

[12]
GEHL J. Life Between Buildings: Using Public Space[M]. Washington, D. C.: Danish Architectural Press, 2008.

[13]
张赫, 贺晶, 杨天宇, 等 人群动态分布感知下的天津市公园活力特征及影响因素研究[J]. 风景园林, 2023, 30 (7): 36.-42.

ZHANG H, HE J, YANG T Y, et al Research on Vitality Characteristics and Influence Factors of Urban Parks in Tianjin Under the Perception of Dynamic Population Distribution[J]. Landscape Architecture, 2023, 30 (7): 36.-42.

[14]
朱震军, 曹湛, 和煜栋, 等 基于MGWR的轨道站点周边建成环境对街道活力影响研究[J]. 现代城市研究, 2024, 39 (9): 95.-99.

ZHU Z J, CAO Z, HE Y D, et al Research on the Influence of Built Environment Around Rail Transit Station on Street Vitality Based on MGWR[J]. Modern Urban Research, 2024, 39 (9): 95.-99.

[15]
魏迪, 陆毅, 汪原, 等 信息流介入公共空间活力营造: 基于城市公园的大数据循证分析[J]. 风景园林, 2023, 30 (7): 86.-93.

WEI D, LU Y, WANG Y, et al Intervention of Information Flow in the Creation of Public Space Vitality: An Evidence-Based Analysis of Big Data Based on Urban Parks[J]. Landscape Architecture, 2023, 30 (7): 86.-93.

[16]
何夏萱, 袁奇峰, 卢俊文, 等 基于多源大数据的广州市城市公园人群时空活动模式与规划策略研究[J]. 现代城市研究, 2025, 40 (1): 7.-14.

HE X X, YUAN Q F, LU J W, et al Research on the Spatiotemporal Activity Patterns and Planning Strategies of Urban Park Users in Guangzhou City Based on Multi-source Big Data[J]. Modern Urban Research, 2025, 40 (1): 7.-14.

[17]
钮心毅, 康宁 上海郊野公园游客活动时空特征及其影响因素: 基于手机信令数据的研究[J]. 中国园林, 2021, 37 (8): 39.-43.

NIU X Y, KANG N Spatio-temporal Characteristics and Influencing Factors of Tourist Activities in Shanghai Country Parks: A Study Based on Mobile Phone Signaling Data[J]. Chinese Landscape Architecture, 2021, 37 (8): 39.-43.

[18]
尹静一, 汤晓敏, 王云 人本视角下滨水公共空间活力评估与调控研究: 以上海黄浦江核心段为例[J]. 中国园林, 2022, 38 (9): 81.-86.

YIN J Y, TANG X M, WANG Y Research on the Vitality Evaluation and Regulation of Waterfront Public Space from the Perspective of Humanism: A Case Study of the Core Section of Huangpu River in Shanghai as an Example[J]. Chinese Landscape Architecture, 2022, 38 (9): 81.-86.

[19]
邹闻婷.城市公园空间活力多维综合评估及影响因素探究: 以南京市中心城区为例[D].南京: 东南大学, 2021.

ZOU W T. Multidimensional Comprehensive Evaluation of Urban Park Space Vitality and Its Influencing Factors: A Case Study of Downtown Nanjing[D]. Nanjing: Southeast University, 2021.

[20]
OUYANG J N, FAN H, WANG L Y, et al Revealing Urban Vibrancy Stability Based on Human Activity Time-Series[J]. Sustainable Cities and Society, 2022, 85: 104053.

DOI

[21]
盛强, 方可 基于多源数据空间句法分析的数字化城市设计: 以武汉三阳路城市更新项目为例[J]. 国际城市规划, 2018, 33 (1): 52.-59.

DOI

SHENG Q, FANG K Digital Urban Design Using Space Syntax Analysis Based on Multi-source Data: An Urban Renewal Project in Wuhan Sanyanglu Area[J]. Urban Planning International, 2018, 33 (1): 52.-59.

DOI

[22]
WANG J M, HUANG K, PI J Y. RUP2S-YOLO: An Improved YOLOv8-Based Algorithm for Dense Pedestrian Detection[C]//Institute of Electrical and Electronics Engineers. 2024 5th International Seminar on Artificial Intelligence, Networking and Information Technology. Piscataway: IEEE, 2024: 667-671.

[23]
YANG D B, GONZALEZ-BANOS H H, GUIBAS L J. Counting People in Crowds with a Real-Time Network of Simple Image Sensors[C]//Institute of Electrical and Electronics Engineers. Proceedings Ninth IEEE International Conference on Computer Vision. Piscataway: IEEE, 2003: 122-129.

[24]
陈海秀, 陈子昂, 房威志, 等.复杂场景下的改进YOLOv8-n密集行人检测模型[J/OL].计算机工程, 1-12[2025-08-08].https://doi.org/10.19678/j.issn.1000-3428.0070531.

CHEN H X, CHEN Z A, FANG W Z, et al. An Improved Dense Pedestrian Detection Algorithm Based on YOLOv8-n in Complex Scenes[J/OL]. Computer Engineering, 1-12[2025-08-08]. https://doi.org/10.19678/j.issn.1000-3428.0070531.

[25]
郭睿, 乐艳艳, 刁志强, 等 “双碳”视角下西安幸福林带项目植物碳储量及优化策略[J]. 现代园艺, 2023 22 182.-183.

GUO R, LE Y Y, DIAO Z Q, et al Plant Carbon Storage and Optimization Strategy of Xi’an Happiness Forest Belt Project from the Perspective of “Double Carbon”[J]. Contemporary Horticulture, 2023 22 182.-183.

[26]
陈海山, 梁裕珩 人口集聚与植被恢复: 基于人口空间分布的实证研究[J]. 经济学(季刊), 2023, 23 (5): 2025.-2041.

CHEN H S, LIANG Y H Population Agglomeration and Vegetation Restoration: An Empirical Study Based on Population Spatial Distribution[J]. China Economic Quarterly, 2023, 23 (5): 2025.-2041.

[27]
GHOSE D, DESAI S M, BHATTACHARYA S, et al. Pedestrian Detection in Thermal Images Using Saliency Maps[C]//Institute of Electrical and Electronics Engineers. 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. Piscataway: IEEE, 2019: 988-997.

Outlines

/