Measurement of the Public Activity Richness of Urban Park Based on Large Language Models and Social Media Data: A Case Study of Shanghai

Yue ZHONG; Yuxuan LIU; Yu YE

doi:10.3724/j.fjyl.202406290356

2024 , Vol. 31 >Issue 9: 34 - 41

DOI: https://doi.org/10.3724/j.fjyl.202406290356

Special: Application of Artificial Intelligence in Landscape Architecture

Measurement of the Public Activity Richness of Urban Park Based on Large Language Models and Social Media Data: A Case Study of Shanghai

Yue ZHONG ,
Yuxuan LIU ,
Yu YE ^,²^,^*

Expand

Key Laboratory of Ecology and Energy-Saving Study of Dense Habitat, Ministry of Education
College of Architecture and Urban Planning (CAUP), Tongji University

yye@tongji.edu.cn

ZHONG Yue, Master, is an assistant research fellow in the Key Laboratory of Ecology and Energy-Saving Study of Dense Habitat, Ministry of Education. Her research focuses on computational urban design

LIU Yuxuan, Master, is an assistant research fellow in the Key Laboratory of Ecology and Energy-Saving Study of Dense Habitat, Ministry of Education. Her research focuses on computational urban design

YE Yu, Ph.D., is an associate professor and deputy director of Built Environment Technology Center in the College of Architecture and Urban Planning (CAUP), Tongji University, and deputy director of the Key Laboratory of Ecology and Energy-Saving Study of Dense Habitat, Ministry of Education. His research focuses on computational urban design

Received date: 2024-06-29

Revised date: 2024-07-28

Online published: 2025-12-16

Copyright

Fold

Abstract

[Objective] Urban parks are one of the most vital carriers of public services. Public perception and usage of urban parks can significantly impact their management and planning. In recent years, social media data has emerged as a critical source for understanding public interaction within urban spaces, making park analysis based on social media a research hotspot. However, the current research typically focuses on single-mode data analysis (such as text or image), and relies on traditional machine learning and natural language processing (NLP) techniques, which may limit the comprehensiveness and accuracy of research results. Advancements in artificial intelligence, particularly in large language models (LLM), have made significant breakthroughs in language understanding, reasoning, and image recognition, providing the technical foundation for using multi-modal social media data, including image and text, to analyze the rich urban park activities. This research aims to explore the methods for quantitative analysis of multi-modal social media big data to build a more accurate measurement system for park public activity richness.

[Methods] Taking Shanghai Gongqing National Forest Park, the most popular and discussed urban park on the social media platform “Xiaohongshu”, as an example, this research employs a combination of classical questionnaire methods, LLM analysis, and traditional classical analysis methods. First, through the design and implementation of a semantic analysis questionnaire, multiple uniform surveys are conducted at the 43 most popular spots in Gongqing National Forest Park to understand public activity preferences and perceptions of different scenes. Descriptive statistical methods are used for analyzing activity intention data. Respondents are presented with images of various park scenes and their locations, and are required to detail their expected activities such as walking, running, or picnicking. The semantic differential (SD) method is used to analyze site perception data. Through statistical analysis of respondents’ ratings on different perception dimensions, a comprehensive perception evaluation of each scene is conducted to help construct quantitative indicators of activity preferences and emotional tendencies. And GIS technology is adopted to visualize public activity richness. Second, for the LLM analysis method, multi-modal data (text, image, video, etc.) from the 43 most popular spots in Gongqing National Forest Park on the Xiaohongshu platform are mined. For text data analysis, the application programming interface (API) of China’s leading LLM, Wenxin Yiyan, was used to extract activity information and calculate sentiment values. This helped identify activities and emotions of “Xiaohongshu” users in the park. For image data analysis, the API of ChatGPT-4 was used to extract activity information. Since LLM can’t directly process videos, the videos were first converted into frames and then analyzed using the same method as for images. The Shannon’s diversity index formula is adopted to calculate activity diversity in combination with the type and quantity of activities extracted from the multi-modal data, based on which a quantitative image of urban park public activity richness is constructed. Third, in the traditional classical analysis method, text data from the multi-modal data (all text portions of “Xiaohongshu” notes) are extracted as original data. The latent dirichlet allocation (LDA) model is adopted for topic modeling analysis, and NLP technology for calculation of sentiment values for each topic. Additionally, the diversity of various activities and sentiment values are combined to construct single-modal data indicators.

[Results] This research explores various measurement methods for public activity richness. Using traditional questionnaire perception measurement as a benchmark, correlation analysis is conducted to compare the accuracy of traditional classical analysis and LLM analysis. Statistical results show that LLM analysis can significantly outperforms traditional classical analysis in terms of accuracy for public activity richness and emotional perception data, demonstrating high consistency with the benchmark questionnaire method. And LLM analysis proves superior in evaluating public activity richness. Based on these findings, LLM technology and multi-modal social media data are used to conduct large-scale data retrieval and analysis of the 20 largest urban parks within Shanghai’s Outer Ring, and public activity richness and sub-indicators for these parks are calculated, forming activity portrait for each park, including activity heat data, activity type, and emotional perception data. Moreover, specific suggestions for urban park improvement strategies are provided, achieving a panoramic and high-precision analysis of park public activity richness.

[Conclusion] This research innovatively adopts LLM and multi-modal social media data for urban analysis, supporting comprehensive and rapid monitoring of urban park activities and user perceptions from the city scale to a larger scale. This can not only improve research efficiency and accuracy, but also provide scientific evidence for urban park planning and management. The successful application of this method indicates a scholarly transformation and deepening development of artificial intelligence in urban research, holding significant importance for promoting smart city construction and management.

Key words： landscape architecture; urban park; public activity richness; large language model; multi-modal data; social media data

Cite this article

Yue ZHONG , Yuxuan LIU , Yu YE . Measurement of the Public Activity Richness of Urban Park Based on Large Language Models and Social Media Data: A Case Study of Shanghai[J]. Landscape Architecture, 2024 , 31(9) : 34 -41 . DOI: 10.3724/j.fjyl.202406290356

1 利用多模态社交媒体数据与大语言模型解析城市公园公众活动

城市公园是提供城市公共服务最重要的场所之一，人们可以通过多种方式从中受益。城市公园促进了自然与城市社区之间的互动，增强了社会凝聚力，推动了社会参与并减少了公众的孤立感。相关研究表明，城市公园在塑造社区身份感、地方认同感和公共空间共同拥有感方面发挥着重要作用^[1]。在公园中与自然互动有助于减轻人们的压力，促进亲社会行为。深入了解公众对公园的使用和感知有助于优化公园的规划和管理^[2-3]，对人类和社会福祉产生积极影响。

近年来，社交媒体数据被视为识别和理解公众与城市空间互动方式的重要途径^[4]。通过大数据来理解城市环境有助于揭示城市区域的隐藏特征。社交媒体数据作为大数据的一种类型，可以帮助学者深入理解人们对城市空间的态度和感知，并解释人们的行为^[4]。社交媒体数据具有争议性小、数据量大和实时性强等显著优势。随着人工智能技术的发展，大语言模型（large language models, LLM）在语言理解、逻辑推理和图形识别上取得了巨大突破^[5]，为通过图像、文本、视频等多模态社交媒体数据解析丰富的城市公园公众活动提供了技术支持。本研究以传统问卷方法为参照标准，比较单模态数据分析法与基于多模态数据的LLM分析法的准确性，探讨多模态社交媒体数据的量化分析方法，以构建更准确的公园公众活动丰富度测度体系。

2 文献综述

2.1 基于多源数据的城市公园公众活动分析

在城市公园方面，当前利用社交媒体数据的主流研究主要聚焦于3个维度：公园访问量估算、访客空间分布解析，以及访客体验综合评估^[6]。首先，在公园访问量估算方面，多数研究仅将社交媒体数据的数量，即一天中访客发布的照片或帖子的数量，简单地等同于访客数量^[7-10]，缺乏对图片与文本深层信息的精细挖掘。其次，在访客空间分布解析方面，部分研究探讨了影响访客流量的潜在空间要素，并关注了生态系统文化服务（cultural ecosystem services, CES）的空间分布情况。最后，在访客体验综合评估方面，多数研究聚焦于对CES的探讨^[11]，而对城市空间内公众的行为、感知、偏好与情感等方面的研究相对匮乏^[12-13]。然而，公众对城市公园的认知与使用情况对公园的管理与规划具有深远影响，深入解析公众如何、何时利用城市绿色空间，以及利用城市绿色空间的潜在障碍至关重要^[14-15]。虽然研究公园公众活动丰富度具有显著价值，但当前的主流研究对此仍缺乏深入关注。

在研究方法上，依据数据类型可将当前公园公众活动研究主要分为两大流派。1）基于文本数据的研究多采用关键词分析来识别活动类型^{[4, 16-17]}，或探讨不同用户类型（如居民与游客）的行为模式^[18-19]。然而，无论是关键词分析法还是用户类型分析法，均依赖于机器学习与自然语言处理（natural language processing, NLP）技术，对于复杂、开放性问题或文本内容的深度解析存在局限。2）基于图片数据的研究主要关注人类与环境互动的空间模式^[20-21]，利用图像分析算法识别景观元素^[22]，但此类研究在数据的解读上深度仍不足。因此，现有研究方法在挖掘公园公众活动的有效信息方面存在局限。

在数据选择上，当前研究多基于单模态的社交媒体数据（图片或文本），科学性与合理性值得商榷。人类通过多元感官感知世界，这些感官信息相互补充、协同作用^[5]。社交媒体数据表现为多模态形式，如图片、文字和视频等，分析多模态数据能够得出更全面、准确的结果。

综上所述，当前研究在深度挖掘多模态社交媒体数据以分析城市公园公众活动方面存在不足。因此，有必要利用先进的LLM等技术手段，构建城市公园公众活动丰富度的测度体系，完善公园公众活动的量化研究方法，为城市公园的规划与管理提供更科学、全面的依据。

2.2 基于LLM的多模态数据处理为诸多领域提供了深度解析的可能

早期的NLP技术主要依赖于手工编写的规则和简单的统计模型，在处理基础任务（如语法检查）时虽有一定效果，但在复杂的语言理解和生成方面存在不足。2017年，注意力机制和Transformer架构的引入彻底改变了这一局面，这标志着NLP领域的重大突破^[23]。Transformer架构在处理长文本和并行计算方面表现出色，极大地推动了NLP技术的发展。

随后，预训练-微调范式的兴起，特别是以生成式预训练模型（generative pre-trained transformer, GPT）和BERT为代表的模型，进一步提高了语言模型的性能。这些模型首先基于大量文本数据进行无监督预训练，然后在特定任务上进行微调，从而实现对语言的深度理解和生成。OpenAI的GPT系列模型，尤其是ChatGPT-4以庞大的参数规模和强大的生成能力展现了LLM的巨大潜力。

近年来，随着深度学习技术不断发展，多模态模型开始崭露头角，如DALL-E和基于对比学习的语言-图像预训练（contrastive language-image pre-training, CLIP）模型等。这些模型能够理解和生成跨模态的内容，包括文本、图像、音频和视频等多种形式的数据。LLM在解析多模态数据时，通过特征提取与融合、联合训练，以及注意力机制与Transformer架构等方法，实现了对多模态数据的深度解析。在图像生成、图像描述生成、跨模态检索、自动驾驶和医疗诊断等众多领域应用广泛。

在城市设计研究中，基于多模态数据的LLM展现出了巨大的应用潜力。LLM不仅能够处理和分析文本数据，如智能问答、文本分类和文本生成，还能将图像和视频数据转化为可解析的文字描述，从而帮助人们更全面地理解城市环境^[24]。但是当前的LLM在融合和解析多模态数据方面还存在局限性。为了更有效地实现多模态数据的深度融合和解析，未来的研究需要探索更先进的技术和方法。特别是在城市设计中，综合利用文本、图像和视频等多种形式的数据，准确描绘公众的活动偏好和情绪倾向，是重要且紧迫的研究方向^[25]。

总之，基于LLM的多模态数据处理为城市设计研究提供了全新的视角和方法。融合和分析多模态数据能够帮助我们更深入地理解城市环境，进而提高城市空间的质量和使用效率。

2.3 研究局限与未来展望

分析当前基于多源数据的城市公园公众活动与行为研究，发现多数研究采用了NLP技术，在分析结果的可靠性方面仍有待提升。既有研究对多模态数据的整合处理缺乏足够的重视，尚未形成一套系统且有效的研究框架。因此，未来的研究应聚焦于提高多模态数据处理的精准度与效率，探索更科学的数据融合策略，并积极利用LLM等前沿分析工具，为全面且深入地探究城市公园中公众的活动偏好和情绪倾向提供技术支持。

3 研究设计

3.1 研究框架和关键指标

本研究旨在通过先进的技术手段精准测度城市公园公众活动丰富度，选取上海外环内面积较大的20个城市公园作为研究样本，深入探讨这些公园内活动类型的多样性与游客情绪的丰富性，并通过数据可视化呈现研究成果。

在数据处理层面，首先本研究借助精细设计的语义分析问卷在公园收集数据，并对数据进行深入分析，运用语义差异（semantic differential, SD）法制定活动偏好与情绪倾向的量化指标。其次，从热门社交媒体平台小红书中挖掘数据，借助先进的LLM对多模态数据进行深度解析，准确捕捉活动偏好与情绪倾向；基于QGIS软件，结合位置信息，在地图上实现数据的可视化表达，制定多模态数据指标。最后，对于多模态数据中的文本部分，运用潜在狄利克雷分配（latent dirichlet allocation, LDA）模型与NLP技术进行主题建模与情绪分析，结合词频统计制定单模态数据指标。

在数据分析方面，将基于社交媒体数据制定的多模态数据指标和单模态数据指标与基于SD法制定的指标进行相关性分析，以验证不同方法的准确性，并通过解释性分析揭示各指标对城市公园公众活动丰富度的影响趋势。随后，将准确性较高的方法应用于上海20个城市公园公众活动丰富度的测度实践中。基于详尽的数据分析，提出基于社交媒体数据的公园公众活动丰富度与感知多样性的规律性认识，以及城市公园公众活动丰富度和空间品质提升的具体建议。

本研究流程涵盖六大关键步骤（图1）：数据收集、单模态数据指标测度、多模态数据指标测度、环境心理学指标测度、准确性检验以及大规模量化分析，以确保研究的系统性、全面性与精准性。

显示原图|下载原图ZIP|生成PPT

图1 研究框架

Fig. 1 Research framework

3.2 研究案例

本研究选取上海共青国家森林公园作为研究案例（图2）。首先，该公园以森林景观为主，功能分区多样，活动类型丰富，是研究公众活动的理想案例。其次，该公园是小红书平台中上海城市公园搜索量与发文量最多的公园。因此，选用知名度高、面积大的共青国家森林公园作为研究案例具有典型性。

显示原图|下载原图ZIP|生成PPT

图2 研究案例

Fig. 2 Research case

3.3 数据收集

3.3.1 基于SD法的问卷调查分析

为了解公众在公园各场地中的活动偏好以及对场地的感知情况，本研究设计并开展了一项问卷调查，对共青国家森林公园中最热门的43个景点进行了为期2周的多次调研，调研时间为2024年6月3—16日每天8:00—20:00。本研究邀请了众多游客参与此次调查，旨在收集他们对公园体验的真实反馈。此外，本研究以传统问卷方法为参照标准，来比较单模态数据分析法和LLM分析法的准确性，考虑到社交媒体用户多为中青年群体，问卷调查主要选取中青年进行访问，以确保验证的准确性。

调查问卷中展示了公园中多个景点的场景图片以及此场景在公园中的位置。受访者需详细填写他们在每个场景中期望参与的活动，如散步、跑步、野餐等，以全面捕捉他们的活动倾向。同时，本研究采用了目前广泛应用的SD法。在多元数据核心技术出现之前，SD法作为一种经典的方法备受重视^[26-28]。通过一系列对立的形容词对（如“整洁、脏乱”“吸引人、乏味”等），让受访者对场地进行量化评分，以精准把握游客对场地的感知情况。

问卷调查以面对面的形式进行，每位受访者的调查时间约为10 min，共获得183份有效问卷。对于活动意向数据，本研究使用了描述性统计的方法，以识别最受欢迎的活动类型和不同场景的偏好。对于场地感知数据。本研究运用SD法统计分析受访者对不同形容词对的评分，得出受访者对每个场景的综合感知评价：首先，计算受访者对所有感知维度评分（评分范围为1~7分）的平均值，然后将这些平均值进行归一化处理，得到每类活动的情绪评分，最后运用信息熵、香农多样性指数加权计算每类活动的综合感知数据，得到每个景点的活动多样性，进而得到最终的活动丰富度数据，并使用QGIS进行可视化分析（图3）。

显示原图|下载原图ZIP|生成PPT

图3 基于问卷调查计算的公众活动丰富度

Fig. 3 Public activity richness calculated based on questionnaire

本研究使用的活动丰富度计算式源自生物多样性计算式——香农多样性指数。该计算式不仅考虑了活动的种类和数量，还结合情绪评分对活动的重要性进行了加权计算，能够全面地反映不同活动的多样性和丰富度。该方法以每类活动的情绪评分为权重，能够准确评估不同体量的活动对情绪的影响，提供一个全面的活动丰富度衡量标准。基于问卷调查计算的活动丰富度计算式

(1)$ H=-{\sum }_{i=1}^{R}{w}_{i}{p}_{i}\mathrm{ln}{p}_{i}， $

式中：H为加权香农多样性指数，即活动丰富度；R为活动类型总数；$ {p}_{i} $为第$ i $种活动的相对丰度，即第$ i $种活动出现的次数占总次数的比例；$ {w}_{i} $是第$ i $种活动的权重，即某种活动的情绪评分。

3.3.2 基于LDA模型和NLP技术的文本数据分析

在数据收集阶段，本研究提取了多模态数据中的文本数据（抓取的小红书笔记的文字部分）作为原始数据。在研究方法的选择上，鉴于现有研究中活动信息或主题的识别多依赖于特征词提取（如Word2vec模型）或聚类算法（如DBSCAN、LDA等）^[29]，本研究采用了当前广泛使用的LDA模型进行主题建模分析。LDA作为一种无监督学习方法，能够有效地从文本集合中推测出潜在的主题分布情况：每个文档可以视为多个主题的组合，每个主题可以反映多个词的概率分布。

然而，这一研究方法在语义处理深度方面存在局限，可能会使活动数据的真实性受到一定程度的影响。此外，单纯依赖LDA模型进行主题建模，将分析结果（即每个主题）直接等同于各类活动信息的准确性值得进一步探讨。

为了更全面地理解社交媒体用户对特定景点活动的情感态度，本研究进一步运用NLP技术直接计算LDA建模分析得出的现有主题下的情绪评分。通过整合主题建模数据，本研究计算了各类活动的多样性（图4），并结合情绪评分计算了基于单模态数据的活动丰富度，计算式

(2)$ A=-E{\sum }_{i=1}^{R}{p}_{i}\mathrm{ln}{p}_{i}， $

式中：A为活动丰富度；E为每个点的活动情绪评分均值；R为活动类型总数；$ {p}_{i} $为第$ i $种活动的相对丰度，即第$ i $种活动出现的次数占总次数的比例。

显示原图|下载原图ZIP|生成PPT

图4 基于单模态数据计算的公众活动丰富度

Fig. 4 Public activity richness calculated based on single-modal data

3.3.3 基于LLM的多模态数据分析

本研究基于多模态数据对公园公众活动进行了深入分析。抓取小红书上涉及共青国家森林公园内最热门的43个景点的笔记作为原始数据，并按不同景点进行分类，对每一篇笔记的文本、图片和视频进行详细分析（图5）和数据提取（图6）。

显示原图|下载原图ZIP|生成PPT

图5 多模态数据获取流程

Fig. 5 Process of acquiring multi-modal data

显示原图|下载原图ZIP|生成PPT

图6 公园内野牧亭景点的多模态数据

Fig. 6 Multi-modal data of Yemu Pavilion (“Yemuting”), a specific scenic spot within the park

对于文本数据分析，鉴于文本内容主要为中文，本研究利用国内领先的LLM——文心一言的应用程序编程接口（application programming interface, API）提取活动信息。对于输入的每条笔记文本，文心一言能够精准识别文本内容涉及的活动类型，并输出对应的语句。随后，运用NLP技术对这些语句进行情绪评分计算，从而得到小红书用户在公园内进行的各类活动以及他们对这些活动的情感倾向。

对于图片数据分析，本研究采用当前研究中最热门的LLM——ChatGPT-4的API提取图片中的活动信息。这一先进的模型能够准确地识别出图片中的活动内容。

对于视频数据分析，由于当前的LLM尚未具备直接读取视频信息的能力，本研究采取了一种间接的方法：将视频转化为一帧帧的图片，沿用图片数据分析的方法，利用ChatGPT-4的API提取视频中每一帧图片的活动信息。

为了全面评估公园公众活动丰富度，本研究运用香农多样性指数，结合多模态数据提取的每个景点的活动类型及数量来计算活动的丰富度（式1，图7）。该结果深度反映了用户在公园内的活动情况。

显示原图|下载原图ZIP|生成PPT

图7 基于多模态数据计算的公众活动丰富度

Fig. 7 Public activity richness calculated based on multi-modal data

4 数据分析

4.1 活动丰富度测度方法效能检验

本研究深入探讨了活动丰富度的多元测度方法，以基于SD法的问卷调查分析结果为参考标准，通过相关性分析验证了单模态数据分析法与多模态数据分析法的有效性。统计结果显示，单模态数据分析法与多模态数据分析法测得的活动丰富度均与问卷分析结果呈正相关（图8）。但是多模态数据分析法展现出更高的拟合优度，相关系数为0.63，而单模态数据分析法的拟合优度较低，相关系数仅为0.50。由此可见多模态数据分析法在活动丰富度评估方面的优越性。

显示原图|下载原图ZIP|生成PPT

图8 活动丰富度相关性分析

Fig. 8 Correlation analysis of public activity richness

对于情绪感知数据，以基于SD法的问卷调查分析获取的评分数据为基准进行相关性分析与有效性检验。分析结果表明，在利用NLP技术获得的情绪评分中，基于LLM的多模态数据分析计算结果与基于SD法的问卷调查分析计算结果呈高度正相关，相关系数为0.70；基于NLP的单模态数据分析计算结果与问卷调查分析计算结果呈中度正相关，相关系数为0.46（图9）。上述结果进一步验证了多模态数据分析法在情绪感知分析方面的有效性。

显示原图|下载原图ZIP|生成PPT

图9 情绪评分相关性分析

Fig. 9 Correlation analysis of emotional values

综上所述，通过有效性检验，本研究证实了多模态数据分析法在活动丰富度和情绪感知数据测度中的可行性与可靠性。

4.2 城市公园公众活动丰富度大规模量化分析

通过LLM多模态数据分析法，本研究对城市公园公众活动进行大规模分析量化，构建出基于多源数据的不同城市公园的公众活动丰富度画像。以上海为研究样地，选取位于上海外环以内、占地面积较大的20个城市公园（图10）。这些公园类型丰富，涵盖历史文化类（如鲁迅公园）、体育休闲类（如闵行体育公园）、生态景观类（如大宁郁金香公园）等多种类型，具有全面性和代表性。本研究对20个公园进行了大规模的数据检索与分析，计算得到20个公园的公众活动丰富度以及细分指标，进而构建各公园的公众活动丰富度画像（图11），包括活动热力、活动类型和情绪感知。

显示原图|下载原图ZIP|生成PPT

图10 20个城市公园的空间分布

Fig. 10 Spatial distribution of 20 urban parks

显示原图|下载原图ZIP|生成PPT

图11 20个城市公园的公众活动丰富度画像

Fig. 11 Public activity richness portraits of 20 urban parks

公众活动丰富度画像能够揭示不同公园公众活动水平和情绪感知的差异。整体来看，活动热力较高的公园（如长风公园、鲁迅公园）通常能够带来更积极的情绪感知。共青国家森林公园公众活动热力、活动类型和情绪感知3个指标的得分在20个公园中均最高（均为1），表明该公园公众活动类型丰富、活动参与度高，且为人们带来了积极的情绪感知。反之，黄兴公园3个指标的得分均较低，表明该公园公众活动类型较少、热力不足，为人们带来的情绪感知相对较弱。闵行文化公园在活动类型和活动热力上得分较低，但情绪感知得分极高，这可能受益于其独特的文化和环境氛围。基于上述分析结果，对于活动类型、活动热力得分较低的公园，可以增加多样化的活动和设施，提升吸引力和访客满意度。同时，对于情绪感知评分较低的公园，可以通过改善环境质量、提升文化氛围，强化访客的积极情绪体验。这些结论为城市公园的规划和管理提供了重要参考，展示了LLM在多模态数据解析中的强大能力，有助于提升公园的综合价值和居民的生活质量。

5 讨论与总结

5.1 基于多模态数据分析法的活动丰富度测度技术

本研究通过LLM对社交媒体中城市公园公众活动的多模态数据进行爬取、梳理和分析，提出了针对城市公园公众活动丰富度的测度技术。在研究公园公众活动时，传统方法常常难以兼顾大规模数据收集和精细化分析。SD法能够细致地分析人们在公园中希望进行的活动类型及感知倾向，但通常仅适用于小尺度的城市公园或局部区域，在大型城市公园的研究方面往往耗时费力。单模态数据分析法可以进行大规模检索，但存在片面性和不准确性的问题。基于多模态数据的活动丰富度测度技术能够精细化地快速监测市域乃至更大尺度的城市公园全时段的公众活动及感知情况。这一技术的应用不仅能够提升城市公园公众活动研究的效率和精度，还可以为城市公园的规划与管理提供更科学和全面的依据。

5.2 研究局限与未来展望

本研究的亮点在于积极利用LLM等前沿分析工具，基于多模态数据对城市公园公众活动丰富度进行测度。然而，本研究仍存在一定的局限性。

目前利用LLM处理多模态数据仍然会出现解析错误的情况^{[24, 30]}。数据语义本身可能含糊不清，导致一些与公园空间使用不相关的活动词汇被误筛选为活动类型，例如“举手” “竖起大拇指”等，这导致了活动类型和数量数据的偏差。本研究共抓取了30 517条小红书笔记，涵盖数百万字的文本、数十万份图片和视频文件，经过一周的人工抽样校核，发现LLM解析活动数据的错误率极低，甚至在某种程度上超出了人力校核的能力。因此，尽管LLM输出的结果可能存在一定程度的错漏，但在处理海量文本方面仍能保证非常高的精度。

小红书等社交媒体平台的用户主要是中青年群体，无法全面代表公园中的老年人和儿童群体。因此，本研究仅依赖小红书数据对上海外环内面积较大的20个城市公园进行活动丰富度解析，结果的覆盖度和准确性有待提高。未来的研究应探索问卷调查与社交媒体多源数据解析相结合的模式，以保证活动特征采集和年龄群体覆盖的全面性，从而提高研究结果的准确性和可靠性。

5.3 LLM赋能下的学科范式转型契机

包括风景园林在内的人居环境学科的研究通常遵循感知、分析、设计到政策制定的范式。使用LLM处理多模态数据为传统范式提供了全新的分析视角。随着人工智能技术的发展，LLM能够以近乎人类的解析能力进行广泛的数据解析，从而实现对本底感知的全面理解和类专家经验的模拟。在过去的10年中，数字化技术的发展丰富了数据的类型，未来将面临从数字化向智能化的进一步探索和挑战。应用人工智能模型能够帮助我们更有效地解析数据，更深入地理解基础环境，推动整个学科范式向更科学的方向转型。

文中图片均由作者绘制，其中图2~4、7、10底图来源于mapbox，图5左图截图自小红书。

References

Publishing order | Descend order by publishing year | Descend order by cited within

[1]	KIM J, KAPLAN R. Physical and Psychological Factors in Sense of Community: New Urbanist Kentlands and Nearby Orchard Village[J]. Environment and Behavior, 2004, 36(3): 313-340. DOI

[2]	塔特, 曹新, 吴龙峰. 伟大的城市公园: 环境、持续和连接的重要性[J]. 风景园林, 2018, 25(3): 84-99. TATE A, CAO X, WU L F. Great City Parks: The Importance of Context, Continuity and Connection[J]. Landscape Architecture, 2018, 25(3): 84-99.

[3]	王志芳, 康佳, 徐敏, 等. 北京公园用户类型刻画[J]. 风景园林, 2021, 28(9): 96-102. WANG Z F, KANG J, XU M, et al. Characterizing User Groups in Beijing Parks[J]. Landscape Architecture, 2021, 28(9): 96-102.

[4]	SIM J, MILLER P. Understanding an Urban Park Through Big Data[J]. International Journal of Environmental Research and Public Health, 2019, 16(20): 3816 DOI

[5]	WU S Q, HAO F, QU L G, et al. NExT-GPT: Any-to-Any Multimodal LLM[EB/OL]. (2023-09-11)[2024-06-29]. https://arxiv.org/pdf/2309.05519

[6]	WILKINS E J, WOOD S A, SMITH J W. Uses and Limitations of Social Media to Inform Visitor Use Management in Parks and Protected Areas: A Systematic Review[J]. Environmental Management, 2021, 67(1): 120-132. DOI

[7]	BARROS C, MOYA-GÓMEZ B, GUTIÉRREZ J. Using Geotagged Photographs and GPS Tracks from Social Networks to Analyse Visitor Behaviour in National Parks[J]. Current Issues in Tourism, 2019, 23(10): 1291-1310.

[8]	FISHER D M, WOOD S A, WHITE E M, et al. Recreational Use in Dispersed Public Lands Measured Using Social Media Data and On-Site Counts[J]. Journal of Environmental Management, 2018, 222: 465-474.

[9]	HAMSTEAD Z A, FISHER D, ILIEVA R T, et al. Geolocated Social Media as a Rapid Indicator of Park Visitation and Equitable Park Access[J]. Computers, Environment and Urban Systems, 2018, 72: 38-50. DOI

[10]	KIM Y, KIM C, LEE D K, et al. Quantifying Nature-Based Tourism in Protected Areas in Developing Countries by Using Social Big Data[J]. Tourism Management, 2019, 72: 249-256. DOI

[11]	CLEMENTE P, CALVACHE M, ANTUNES P, et al. Combining Social Media Photographs and Species Distribution Models to Map Cultural Ecosystem Services: The Case of a Natural Park in Portugal[J]. Ecological Indicators, 2019, 96: 59-68. DOI

[12]	ROBERTS H, SADLER J, CHAPMAN L. The Value of Twitter Data for Determining the Emotional Responses of People to Urban Green Spaces: A Case Study and Critical Evaluation[J]. Urban Studies, 2019, 56(4): 818-835. DOI

[13]	HUANG S C L, SUN W E. Exploration of Social Media for Observing Improper Tourist Behaviors in a National Park[J]. Sustainability, 2019, 11(6): 1637 DOI

[14]	ROBERTS H V. Using Twitter Data in Urban Green Space Research: A Case Study and Critical Evaluation[J]. Applied Geography, 2017, 81: 13-20. DOI

[15]	PENG J, CHEN X, LIU Y, et al. Spatial Identification of Multifunctional Landscapes and Associated Influencing Factors in the Beijing-Tianjin-Hebei Region, China[J]. Applied Geography, 2016, 74: 170-181. DOI

[16]	HEIKINHEIMO V, MININ E D, TENKANEN H, et al. User-Generated Geographic Information for Visitor Monitoring in a National Park: A Comparison of Social Media Data and Visitor Survey[J]. ISPRS International Journal of Geo-Information, 2017, 6(3): 85 DOI

[17]	PICKERING C, WALDEN-SCHREINER C, BARROS A, et al. Using Social Media Images and Text to Examine How Tourists View and Value the Highest Mountain in Australia[J]. Journal of Outdoor Recreation and Tourism, 2020, 29: 100252 DOI

[18]	HAUSMANN A, TOIVONEN T, SLOTOW R, et al. Social Media Data Can Be Used to Understand Tourists’ Preferences for Nature-Based Experiences in Protected Areas[J]. Conservation Letters, 2018, 11(1): e12343 DOI

[19]	TENERELLI P, PÜFFEL C, LUQUE S. Spatial Assessment of Aesthetic Services in a Complex Mountain Region: Combining Visual Landscape Properties with Crowdsourced Geographic Information[J]. Landscape Ecol, 2017, 32: 1097-1115. DOI

[20]	SINCLAIR M, GHERMANDI A, SHEELA A M. A Crowdsourced Valuation of Recreational Ecosystem Services Using Social Media Data: An Application to a Tropical Wetland in India[J]. Science of the Total Environment, 2018, 642: 356-365. DOI

[21]	SONG X P, RICHARDS D R, TAN P Y. Using Social Media User Attributes to Understand Human-Environment Interactions at Urban Parks[J]. Scientific Reports, 2020, 10(1): 808 DOI

[22]	LEE S, SON Y. Mapping of User-Perceived Landscape Types and Spatial Distribution Using Crowdsourced Photo Data and Machine Learning: Focusing on Taeanhaean National Park[J]. Journal of Outdoor Recreation and Tourism, 2023, 44: 100616 DOI

[23]	VASWANI A, SHAZEER N, PARMAR N, et al. Attention Is All You Need[C]// VON LUXBURG U. Advances in Neural Information Processing Systems 30. Long Beach: NeurIPS, 2017: 5998-6008.

[24]	WU T Y, HE S Z, LIU J P, et al. A Brief Overview of ChatGPT: The History, Status Quo and Potential Future Development[J]. IEEE/CAA Journal of Automatica Sinica, 2023, 10(5): 1122-1136. DOI

[25]	LUO X M, TONG S L, FANG Z, et al. Frontiers: Machines vs. Humans: The Impact of Artificial Intelligence Chatbot Disclosure on Customer Purchases[J]. Marketing Science, 2019, 38(6): 937-947.

[26]	GIBSON S C. “Let’s Go To the Park.” An Investigation of Older Adults in Australia and Their Motivations for Park Visitation[J]. Landscape and Urban Planning, 2018, 180: 234-246. DOI

[27]	ZHANG W J, YANG J, MA L Y, et al. Factors Affecting the Use of Urban Green Spaces for Physical Activities: Views of Young Urban Residents in Beijing[J]. Urban Forestry & Urban Greening, 2015, 14(4): 851-857.

[28]	SCHIPPERIJN J, BENTSEN P, TROELSEN J, et al. Associations Between Physical Activity and Characteristics of Urban Green Space[J]. Urban Forestry & Urban Greening, 2013, 12(1): 109-116.

[29]	LIU J, MENG B, WANG J, et al. Exploring the Spatiotemporal Patterns of Residents’ Daily Activities Using Text-Based Social Media Data: A Case Study of Beijing, China[J]. ISPRS International Journal of Geo-Information, 2021, 10(6): 389 DOI

[30]	ZHU Q, LUO J. Generative Pre-trained Transformer for Design Concept Generation: An Exploration[C]// International Design Conference. Proceedings of the Design Society: Design 2022. Cambridge: Cambridge University Press, 2022: 1825-1834.

Options

Outlines

模态框（Modal）标题

Abstract

Cite this article

1 利用多模态社交媒体数据与大语言模型解析城市公园公众活动

2 文献综述

2.1 基于多源数据的城市公园公众活动分析

2.2 基于LLM的多模态数据处理为诸多领域提供了深度解析的可能

2.3 研究局限与未来展望

3 研究设计

3.1 研究框架和关键指标

图1 研究框架

3.2 研究案例

图2 研究案例

3.3 数据收集

3.3.1 基于SD法的问卷调查分析

图3 基于问卷调查计算的公众活动丰富度

3.3.2 基于LDA模型和NLP技术的文本数据分析

图4 基于单模态数据计算的公众活动丰富度

3.3.3 基于LLM的多模态数据分析

图5 多模态数据获取流程

图6 公园内野牧亭景点的多模态数据

图7 基于多模态数据计算的公众活动丰富度

4 数据分析

4.1 活动丰富度测度方法效能检验

图8 活动丰富度相关性分析

图9 情绪评分相关性分析

4.2 城市公园公众活动丰富度大规模量化分析

图10 20个城市公园的空间分布

图11 20个城市公园的公众活动丰富度画像

5 讨论与总结

5.1 基于多模态数据分析法的活动丰富度测度技术

5.2 研究局限与未来展望

5.3 LLM赋能下的学科范式转型契机

References