专题:人工智能在风景园林中的应用

城市设计中生成式人工智能应用的进展综述

  • 洪齐远 ,
  • 夏俊豪 ,
  • 龙瀛 , *
展开
  • 清华大学建筑学院

洪齐远/女/清华大学建筑学院在读博士研究生/研究方向为邻里和社区质量评价、规划支持技术

夏俊豪/男/清华大学建筑学院在读硕士研究生/研究方向为未来社区设计及评价

龙瀛/男/博士/清华大学建筑学院教授/研究方向为城乡规划技术科学,包括应用城市建模、城市大数据分析、数据增强设计和城市人工智能等

Copy editor: 王一兰

收稿日期: 2025-06-02

  修回日期: 2025-10-17

  网络出版日期: 2025-12-26

基金资助

国家自然科学基金面上项目“数字经济时代收缩城市空间重构的智能测度、机理认知与规划设计响应研究”(52578077)

版权

版权所有 © 2025 风景园林编辑部

Generative Artificial Intelligence in Urban Design: A Review of Recent Applications

  • HONG Qiyuan ,
  • XIA Junhao ,
  • LONG Ying , *
Expand
  • School of Architecture, Tsinghua University

HONG Qiyuan is a Ph.D. candidate in the School of Architecture, Tsinghua University. Her research focuses on neighbourhood and community quality evaluation, and planning support technology

XIA Junhao is a master student in the School of Architecture, Tsinghua University. His research focuses on design and evaluation of future communities

LONG Ying, Ph.D., is a professor in the School of Architecture, Tsinghua University. His research focuses on urban and rural planning technology science, including applied urban modeling, urban big data analytics, data-enhanced design, urban artificial intelligence, etc

Received date: 2025-06-02

  Revised date: 2025-10-17

  Online published: 2025-12-26

Copyright

Copyright © 2025 Landscape Architecture. All rights reserved.

摘要

【目的】生成式人工智能(generative artificial intelligence, GAI)正深度介入城市设计流程,为复杂任务建构、多角色参与、高效生成提供技术支持。本研究旨在识别GAI在城市设计中的主要应用类型与介入机制,分析其演化趋势与典型特征,并对关键技术挑战与未来研究方向进行梳理。【方法】通过系统检索近10年中英文主流数据库中的代表性研究与案例,纳入125篇与GAI及城市设计交叉相关的文献,构建“GAI技术类型×城市设计任务阶段”的分析框架,将模型划分为图像驱动、语言驱动、结构驱动与反馈优化4类,任务阶段划分为前期分析、方案生成、评估优化与决策、效果表达,并结合设计思维理论,采用技术接受模型(technology acceptance model, TAM)作为描述性分析视角,梳理不同模型在感知有用性/感知易用性上的表现与介入逻辑差异。【结果】研究发现,GAI已广泛嵌入城市设计各阶段任务流程,不同类型模型在多阶段任务中形成了协同耦合机制。图像驱动模型因其直观性与易用性被最早采纳,语言、结构与反馈优化模型在策略建构、规则嵌入与多目标优化中展现出更大潜力,但整体应用仍不均衡。模型组合、跨模态协同与过程迭代呈上升态势,不同模型间感知有用性与易用性的差异影响其应用比例。【结论】当前多数GAI模型仍以过程式组合为主,尚未具备生成式智能的逻辑建构能力,在城市设计中的作用主要体现为任务响应与辅助生成。模型可控性差、可解释性不足与地域数据适应性不强是制约其广泛应用的核心瓶颈。未来研究应聚焦于构建结构化的本土设计数据体系、增强模型的控制透明机制与跨模型协同能力,推动GAI从工具型介入向设计逻辑深度参与者演进。

本文引用格式

洪齐远 , 夏俊豪 , 龙瀛 . 城市设计中生成式人工智能应用的进展综述[J]. 风景园林, 2025 , 32(12) : 24 -34 . DOI: 10.3724/j.fjyl.LA20250329

Abstract

[Objective] As urban design faces increasing demands for contextual responsiveness, iterative optimization, and data-informed reasoning, integrating artificial intelligence into the design process has gained renewed relevance. Among emerging technologies, generative artificial intelligence (GAI) shows strong potential for automating content creation and simulating spatial configurations. This research provides a comprehensive review of recent developments in the application of GAI to urban design. The research identifies representative technical pathways, their respective intervention stages, and the functional mechanisms by which generative models are reshaping the design workflow. This research presents a structured, theory-informed synthesis of how different generative models contribute to tasks such as intention modeling, spatial reasoning, and performance-driven design. Building on design thinking and a descriptive lens informed by the technology acceptance model (TAM), the research examines how model type, data modality, and task characteristics affect GAI’s functional role, usability, and acceptance. Particular attention is given to mapping deployment forms, from isolated tools to coordinated multi-model workflows, and to characterizing cross-cutting challenges of controllability, transparency, and contextual adaptability in urban design settings.
[Methods] Following the PRISMA protocol, the research conducts a multi-stage literature review combining automated search and expert screening. A total of 125 peer-reviewed articles and high-impact preprints are selected from Web of Science, CNKI, arXiv, and selected industry sources, covering the period from 2014 to July 2025. Search terms such as “generative AI”, “AIGC”, “GAN”, “diffusion model”, “variational autoencoder”, “autoregressive model”, “large language model”, and urban-related keywords are used in various combinations. Based on the collected literature, four types of generative models are summarized as image-driven, language-driven, structure-driven, and feedback-optimized models, according to their application characteristics in urban design tasks. These types are aligned with four stages of the design process: preliminary analysis, scheme generation, evaluation and decision-making, and outcome expression. On this basis, a two-dimensional framework to examine how different GAI pathways intervene across tasks is formed. To refine the mapping, each design stage is further broken down into three representative sub-tasks. Preliminary analysis includes public demand analysis, urban data enhancement, case/task framing, and spatial element recognition. Scheme generation covers design intention modeling, spatial layout generation, and 3D form construction. The evaluation and decision-making stage includes multi-objective optimization, scheme evaluation, and scenario prediction. The final expression stage involves textual documentation, 2D representation, and visual rendering. A quantitative analysis is also conducted to show the distribution of model types over design stages, identify common combinations, and trace the evolution of research focus over time. TAM informs a descriptive synthesis of perceived usefulness (PU) and perceived ease of use (PEU) across model types to illuminate adoption patterns.
[Results] The findings reveal that GAI models are increasingly integrated into urban design workflows but exhibit uneven adoption across task types and modalities. Image-driven models dominate in both early-stage analysis and final visual representation due to their high interpretability, usability, and compatibility with existing design practices. Language-driven models are commonly used in public demand analysis, participatory planning, and scenario scripting, enabled by the rise of large language models (LLMs) such as ChatGPT and DeepSeek. Structure-driven models, though less prevalent, show promise in generating street networks, land-parcel layouts, and spatial typologies using graph-based logic. Feedback-optimized models, which rely on reinforcement learning, evolutionary algorithms, and performance simulation are the least adopted, but demonstrate strong potential in multi-objective optimization and iterative decision-making. Recent research indicates an increasing use of multi-model workflows, such as text-to-image pipelines integrated with urban simulation or feedback loops. While GAI applications increasingly support design iteration, their adoption is heavily influenced by the controllability, explainability, and contextual adaptability of models. PU and PEU vary significantly by model type, with image-driven models rated highest and structure-driven and feedback-optimized models facing usability challenges due to complexity and low transparency.
[Conclusion] Although GAI has demonstrated broad applicability across the urban design process, current implementations are largely procedural and auxiliary in nature. Most models recombine existing inputs rather than construct original logic, and few possess autonomous reasoning or normative awareness. This limits their role to content augmentation rather than conceptual guidance in design development. Moreover, issues such as opaque decision logic, lack of domain-specific knowledge embedding, and poor adaptability to local planning norms hinder practical adoption. Addressing these challenges requires multi-level efforts: 1) Construct structured, regionally grounded urban design datasets; 2) improve model interpretability, controllability, and responsiveness to professional input; and 3) develop modular, multi-model systems that support seamless interaction across design stages. Human – AI collaboration mechanisms — especially those based on iterative prompts and semantic feedback-must be enhanced to enable AI not just as a tool, but as an active design partner. This review offers a comprehensive reference for scholars and practitioners seeking to understand how GAI is reshaping the logic, structure, and agency of urban design.

0 引言

城市设计聚焦于城市物质空间品质提升与场所营造,其学理根基可追溯至Kevin Lynch的“意象城市”、Jane Jacobs的“街道活力”与Jan Gehl提出的“人本尺度”等经典理论[1-3],它们共同强调公共空间体验、街区活力与人-空间互动的核心价值。自然资源部《城市设计管理办法》(2020年)明确城市设计的使命为空间品质提升、特色风貌塑造与公共空间优化。《国土空间规划城市设计指南》进一步提出总体规划、详细规划及专项规划三层次的空间尺度与任务分工,明确了城市设计作为空间协同规划的重要角色。城市设计的具体工作涉及前期分析、目标设定、方案构建与评估反馈等多个阶段,且通常伴随公众、政府、开发商等多主体的协作与利益权衡,其决策过程往往周期较长[4]
为提升效率与创造性,城市设计实践长期探索辅助生成技术,经历了依托计算机辅助设计(computer aided design, CAD)、地理信息系统(geographic information system, GIS)、规划支持系统(planning support system, PSS)、城市信息模型(city information modeling, CIM)、数据增强设计(data augmented design, DAD)等系统工具的技术支持阶段,形状语法[5]、元胞自动机[6]、多智能体模型(multi-agent model)等模型生成阶段,以及近年来依托大数据与人工智能实现的数据驱动阶段(图1)。早期技术应用已部分实现设计流程自动化,但仍难以应对复杂情境下的生成任务与知识迁移需求[7]
图1 生成技术的发展及在城市设计中的应用

Fig. 1 Development of generation technologies and their applications in urban design

当前,以基于位置服务(location-based service, LBS)、物联网、社交媒体、遥感影像为代表的城市数据基础不断丰富,为人工智能模型提供了可观的训练语料,使其生成能力显著提升,推动城市设计从“规则驱动”向“数据驱动”加速转型[8]。生成式人工智能(generative artificial intelligence, GAI)作为AI的重要分支,以生成对抗网络(generative adversarial networks, GAN)、扩散模型 (diffusion model)及大语言模型(large language model, LLM)为代表性技术,具备从文本、图像或多模态输入中生成图像、文本、音频乃至策略内容的能力。与传统算法相比,这类模型不仅可基于复杂上下文快速生成多样化方案,还具备在多轮输入中进行自我优化与适应的潜力。2018年,NVIDIA团队发布StyleGAN并将其应用于建筑形态生成,首次将深度生成模型引入城市设计领域,引发首轮GAI技术热潮[9]。2022年起,ChatGPT的爆发式传播以及稳定扩散模型(stable diffusion, SD)等图像模型的普及,显著拓宽了GAI在城市设计流程中从概念构思到视觉表达的应用边界。与此同时,DeepSeek等国产模型的突破加速了技术本土化,规划部门、规划设计单位、互联网企业已开始在业务环节部署模型并纳入规划设计流程,显示出由学术探索迈向产业落地的趋势[10]
然而,GAI在城市设计领域的应用尚处于快速发展阶段,未形成统一框架。现有研究多聚焦于单一模型或特定任务,缺乏对多类型模型在设计流程各阶段中协同作用的系统整合与归纳。尽管已有综述尝试总结AI在城市规划设计领域的发展路径,但仍未能充分覆盖当前GAI的最新技术演进或完整应用进展。例如Jiang等[11]系统梳理了生成式城市设计方法的主要路径与技术要点,但由于文献检索主要在2022年前,未涵盖新一代代表性模型(如ChatGPT、SD)在城市设计实践中的应用。Sanchez等[12]则采用计量综述方法分析AI在城市规划中的宏观演进趋势,但其研究对象更侧重于非生成任务(如预测建模)与广义AI分析;针对GAI的综述,如Lin等[13]、Ozturk等[14]、Xia等[15]分别聚焦于城市形态生成、建筑与工程建模,以及泛城市研究,但均未专注于“城市设计”任务体系。为回应这一研究空白,笔者聚焦于城市设计而非更宽泛的领域,补充纳入近3年高质量研究;系统梳理GAI技术类型与城市设计任务阶段之间的对应逻辑。拟构建“GAI技术类型×城市设计任务阶段”的二维分析框架,并结合设计思维理论,辅助解析GAI技术在各阶段的介入方式与功能适配路径。
在此基础上,提出3个研究目标:1)归纳GAI技术在城市设计全流程中所覆盖的关键任务与阶段;2)对比分析不同类型GAI模型的生成路径与功能侧重;3)探讨当前技术在城市设计实践中面临的关键瓶颈与未来发展趋势。

1 研究方法

1.1 综述方法

为了系统梳理城市设计中运用GAI的文献,笔者遵循系统综述与荟萃分析报告规范(Preferred Reporting Items for Systematic Reviews and Meta-Analyses, PRISMA)[16],并借鉴近期同类综述的通行做法[11, 17]。首先,以可复现的检索式在文献数据库中进行系统检索,初步获得857篇文献;然后,依据既定纳入标准开展人工筛选,最终纳入125篇文献进行分析(图2)。
图2 综述文献筛选流程

Fig. 2 Screening process of literature for review

本研究旨在全面梳理GAI在城市设计领域的研究进展,因此基于“技术范式”与“应用目标”的双重导向进行范围界定。综述对象限定为以GAN、扩散模型、LLM等深度生成算法为核心,且服务于城市空间形态建构或设计决策支持任务的相关研究。此外,鉴于GAN于2014年提出,标志着GAI作为独立方向的兴起,因此将综述时间范围界定为2014—2025年。
采用多阶段文献筛选方法,全面回顾近年来中英文核心文献。在Web of Science核心合集中以“TS = (generat* AND ai OR aigc OR gan OR vae OR diffusion AND model* OR *gpt* OR bert OR llm OR transformer) AND (city OR urban) AND (planning OR design) NOT (traffic OR transport* OR energy OR socialog* OR econom*),type = (article, review)”为检索策略,在中国知网上以“篇关摘 = AIGC + (生成 * 人工智能) + 生成式对抗网络 + 变分自编码 + 扩散模型 + GPT + 大语言模型”AND“篇关摘 = 城市 * (设计 + 规划)”为检索策略,并筛选北大核心、CSCD、WJCI、CSSCI来源,得到857篇文献。阅读标题摘要后得到160篇,阅读全文后共保留104篇,经追溯补充7篇,为覆盖近期技术动向,另有目的性补充14篇最新业界进展报道及arXiv平台高被引预印本,最终纳入125篇文献

1.2 描述性分析

GAI在城市设计领域的相关研究自2017年起逐步出现,自2021年起,随着图像生成模型和大语言模型的突破,文献数量开始增长,至2024年增势明显加速,年度发文数量超过35篇。中文文献在2022年前相对滞后,2023年后增幅显著,显示出国内研究对新一代生成模型的响应与介入主要集中在近2年(图3-1)。
图3 文献统计

Fig. 3 Literature statistics

在技术类型分布上(图3-2),图像驱动模型占比最大,约为总量的1/2,表明以GAN、扩散模型为代表的图像生成路径在城市设计中的应用最为广泛,语言驱动模型和结构驱动模型次之,反馈优化模型数量相对较少。显示出结构逻辑建构和多目标优化等复杂路径尚未形成广泛应用。
从设计流程参与阶段来看(图3-3),GAI已覆盖城市设计的多个任务节点。使用频率较高的包括图像表达与渲染、文本生成、空间语义识别等,主要集中在前期分析与方案表达阶段。涉及性能反馈、结构生成与三维建构的任务占比偏低,反映出这些方向仍在发展中。

2 生成式人工智能技术类型

GAI的发展以深度学习为核心驱动,主要依托于自然语言处理(natural language processing, NLP)与计算机视觉(computer vision, CV)两大领域。在NLP中,Transformer架构已成为主流[18],支持LLM(如GPT、DeepSeek)在语言生成与任务理解中的广泛应用;CV领域则以卷积神经网络(convolutional neural network, CNN)及其变体为基础,近年来逐渐向多模态系统演进,视觉大模型(如SD)通过融合扩散模型与文本-图像对齐技术,实现了语义引导下的高质量图像生成。
本研究基于生成目标与主要输出模态,将应用于城市设计中的GAI方法归纳为4类:图像驱动生成模型、语言驱动生成模型、结构驱动生成模型以及反馈优化生成模型(表1)。各类技术具备不同的输入输出模态,分别适用于不同的生成任务。值得注意的是,前三类模型以生成实体内容(图像、图形、文本)为主,属于内容驱动生成路径;而第四类则以策略选择、性能评估与多目标权衡为核心,即使输出模态同为文本,但内容为优化路径、策略或动态参数的辅助内容,则归属于反馈优化生成模型。
表1 GAI技术类型汇总

Tab. 1 Summary of GAI technology types

类别 图像驱动生成模型 结构驱动生成模型 语言驱动生成模型 反馈优化生成模型
输入模态图像/空间图层图结构/空间关系图自然语言状态/性能/目标函数
输出模态图像图结构/图像文本/图像/ AD图最优参数/解空间
技术代表GAN、diffusion modelGNN、GraphVAE、TopoStreetGPT、T5、LLaVA、CLIPPPO、NSGA-II、ABC
图示

2.1 图像驱动生成模型

图像驱动生成模型以视觉数据为输入,通过图像识别与样式学习等机制,生成建筑形态、街景图像与场景风貌。其核心能力在于从图像到图像的高保真变换,适用于视觉引导型的城市设计任务。
常用方法包括GAN及其变体如条件生成对抗网络(Conditional GAN)、风格生成对抗网络(StyleGAN)等[19-20],支持建筑立面合成与风格迁移;变分自编码器(variational autoencoders, VAE)[21]提供图像重构与潜空间操控能力;扩散模型(如DDPM、Score SDEs等)[22]近年来广泛用于高质量图像生成,尤其在城市场景渲染中表现出色[23-24]

2.2 语言驱动生成模型

语言驱动生成模型以自然语言为输入,通过语义识别与指令解析,生成文本、图像或空间配置等内容,适用于意图构建、任务转译与多轮交互场景。
早期方法如潜在狄利克雷分配(Latent Dirichlet Allocation, LDA)模型用于主题建模和文本分类。近年来,基于Transformer的大语言模型(如GPT、BERT、T5等)成为主流,具备上下文理解与文本生成能力。在城市设计中,这类模型被用于撰写设计说明、解析公众意见等任务。BERT适用于信息提取,GPT更擅长文本生成与提示响应[25-26]
语言驱动生成模型亦常与图像、空间数据集成,形成多模态系统,实现从语言到场景构图的转换,支持“文本生成草图”“语言控制布局”等新型设计流程。

2.3 结构驱动生成模型

结构驱动生成模型以结构本体为输入或输出形式,关注空间要素之间的拓扑关系与组合规律,其生成对象通常具备结构性、可组合性与规则约束,适用于具备明确组织逻辑与构造约束的城市空间生成任务[27]
图神经网络(graph neural network, GNN)是代表性方法之一,基于消息传递机制对节点与边进行联合表征学习,进而支持街道网络、地块分区等图结构的自动生成。其衍生模型如GraphRNN与GraphVAE能实现图样式的递归构建与潜空间控制[28]。此外,Wave Function Collapse算法等基于邻接规则的模型通过局部样本拼贴生成整体结构,适用于受控肌理生长与布局修复[29]

2.4 反馈优化生成模型

反馈优化生成模型通过引入性能评估与策略调节机制,引导生成过程向预设目标演化。其关键在于嵌入优化约束或奖励反馈,以动态控制生成行为,提高结果的可行性与适应性。与传统多目标优化的区别在于,多目标优化通常在既定参数空间内进行权衡搜索,不直接以生成结果的评价信号迭代更新生成模型。
基于强化学习(reinforcement learning, RL)的策略优化是第一类代表性路径,典型结构包括状态空间、动作选择与奖励函数,通过多轮交互学习最优策略。常用算法如近端策略优化算法(proximal policy optimization, PPO)与演员-评论家方法(Actor-Critic),可在连续空间中实现设计行为的动态优化。另一类路径是基于进化与多目标优化的搜索,代表性方法如非支配排序遗传算法Ⅱ(non-dominated sorting genetic algorithm Ⅱ, NSGA-Ⅱ)与人工蜂群算法(artificial bee colony algorithm, ABC),可在多个性能指标如密度、通风、视野之间寻找帕累托最优解,常用于面向性能导向的城市设计调优任务[30]。此类模型也包括利用语言模型进行的策略生成任务,但与语言驱动模型的不同之处在于,本质输出为基于反馈的动态策略路径,而非直接文本内容。

3 生成式人工智能在城市设计中的参与阶段

城市设计是一个涉及空间尺度与多方利益权衡的复杂任务体系[31],其核心实践过程可以很好地映射至经典的设计思维(design thinking)理论提出的5个创造性任务阶段:同理心理解问题、定义问题、创意生成、原型构建和测试反馈。GAI技术参与城市设计任务的各个阶段,本质上体现了设计思维中对任务理解、创意探索、方案构建、反馈优化与成果表达的迭代性与创造性特征。已有综述研究将GAI技术参与城市设计任务划分为“现状认知—趋势预测—方案生成—结果评估”4步骤目标导向[32];亦有学者提出“三阶段模型”,即“问题建构—方案生成—决策制定”[11]。在针对生成式设计的综述中,也有按“方案文本生成—场地布局生成—平面图渲染—效果图生成”的序列进行分类的方式[33]。本研究结合设计思维理论和既有综述分类方式,将城市设计阶段划分为前期分析、方案生成、评估优化与决策、效果表达:“前期分析”阶段对应设计思维的同理心理解与问题定义,GAI提供任务理解和需求解析支持;“方案生成”对应创意生成与原型构建,GAI被用于快速构建多样化的空间构型;“评估优化”对应测试与反馈,GAI支持方案的评估反馈与迭代优化;而“效果表达”则对应成果交流与共创,GAI辅助设计成果的高效表达与传播。在此基础上进一步细化具体任务环节(图4)。
图4 GAI技术类型与参与设计阶段对应关系

Fig. 4 Correspondence between GAI technology types and participation stages in urban design

3.1 前期分析

在城市设计的前期阶段,GAI已被广泛应用于公众需求的解析、基础数据的补全、方案任务的构建、场地要素的语义识别,以及空间行为数据的综合分析等任务中,为后续设计方案生成提供了知识支撑与数据基础。
在公众需求收集与文本解析方面,语言生成模型提升了非结构化文本中公众意见的识别效率。结合ChatGPT的零样本能力与传统的LDA与情绪分析模型,可从社交平台数据中提取对城市议题的情感与偏好[12]。谷歌Gemini-1.5等模型已被用于命名实体识别(named entity recognition, NER),如将政 务公开信息结构化用于后续分析[34]。近期,知识图谱构建与检索增强生成(retrieval-augmented generation, RAG)机制也被引入前期任务中,例如微调DeepSeek以支持对规划规范、历史案例、政策语料的结构化表示与语义查询[35]。图像也是公众偏好表达的重要媒介。例如通过情感分析与图像聚类,提取公众对景观空间的审美倾向,并构建绿道场景下的多维感知指标[36]。部分平台引入GPT等语言模型,支持公众上传图像后自动获取AI标注结果与更新建议。例如“社绘AI”系统可通过图文识别与生成模型联动,辅助生成社区参与式更新图像[37];Betterstreets.ai等语言交互平台则提升了社区数据可读性与居民主观反馈整合能力[38]
在图像数据补全增强方面,GAN具备推断能力,常用于城市数据中缺失信息的补全与细节修复。杨俊宴等[39]提出的ST-FVGAN模型具备时空建模能力,可用于交通流量等城市时序数据的缺失信息重建任务。图像维度上,Zhao等[40]和Tang等[41]分别利用 StyleGAN和LGGAN提高卫星图像和街景语义图的分辨率与表现力;同时,条件生成对抗网络(如pix2pix)等模型也被用于立面图像与地表模型的修复与高清重建[42]。这些处理可为后续设计模拟提供数据源质量的保障。
在案例分析与任务建构中,GAI已被用于辅助城市设计目标的设定。早期的知识驱动方法如案例推理(case-based reasoning, CBR)系统具有良好的可解释性,可通过输入关键参数匹配历史案例,用结构化知识支持设计任务早期建构[43]。Johnsen等[44]使用GAN模型估算新开发片区的人口结构和社会特征,以辅助开发评估。近年来,大语言模型的发展扩展了任务构建方式。基于GPT-4的语言交互系统能将用户的自然语言输入解析为“用途、地段、偏好”等设计参数,被用于自动生成空间分析与选址任务[25];Park等[45]进一步开发了AI智能体系统,模拟虚拟社区居民的记忆与行为,生成连续场景与自然语言对话,为社群偏好识别和规划实验提供了高度拟真的交互平台。
在空间语义识别与要素提取方面,计算机视觉与多模态模型已成为从城市图像中提取空间信息的重要手段。CNN被广泛用于对街景图像进行语义分割与要素标注,并通过回归分析预测街道风貌的演化趋势[23],为后续的空间生成提供类型识别支持。在多模态语义理解方面,Yan等[46]提出UrbanCLIP模型,将遥感图像与网页文本联合训练,通过学习图文对以及LLaMA适配器生成区域的人口、碳排放等语义属性,实现“图像—文本—指标”的跨模态推理。此外,部分平台通过监督微调与提示微调(prompt tuning)提升对城市问题图景的分类精度,同时引入基于嵌入的向量检索(embedding search),将非结构化文本映射为可比较的向量空间,用于语义相似度比对与检索增强(retrieval-augmented generation, RAG)[37],这些机制已成为多模态识别中的关键策略。
综上所述,GAI已在城市设计的前期阶段展现出丰富的应用图谱,从任务理解到数据建构,提高了效率,也增强了语义感知与行为模拟的泛化性能,为后续生成任务奠定了更具综合性的基础。

3.2 方案生成

城市设计中的生成性任务体现为在多重输入与约束条件下,几何形态的建构及对空间组织与形态逻辑的系统性推演。GAI介入设计意图表达、空间结构生成与三维形态构建等多个环节,部分研究亦开始探索反馈调节与人机协同的生成路径。
在设计意图建构即城市设计的前期概念阶段,图像生成模型被用于构建视觉意象、风格图谱与设计意图草图,以辅助设计师进行感性引导与形式探索。Danchenko[47]利用StyleGAN为客户快速生成多样建筑外观图像,借助AI生成的情绪板(moodboards)加强概念确定。2022年后,MidJourney等文本驱动图像生成平台被广泛应用于设计意图图像生成流程中,Jaruga-Rozdolska[48]总结了从关键词生成、多轮生成到图像筛选与草图初步分析的全过程。多模态语言-图像系统亦被用于场景语义的构建任务。UrbanWorld系统结合多模态大语言模型(multimodal LLM, MLLM)与草图引擎,可根据自然语言提示生成具有特定功能语义的场景草图,如“大学教学区”等,展示了从语言意图到空间构图的自动转译能力[49]。部分研究将问题识别、提示词优化与生成模块联动,形成从场地问题识别到方案生成的任务闭环[37]
空间形态布局生成是方案生成的核心部分。生成空间形态的任务通常涵盖土地利用分区、街道与地块划分、建筑布局与街区肌理等多尺度的空间构成。
在土地利用层面,pix2pix是较早被用于模拟城市化模式的经典模型[50],通过输入用地条件(如道路、河流与绿地)并结合建筑布局训练数据,实现对未来空间形态在地理要素约束下的预测。Zhou等[26]进一步提出基于LLM的多代理协商框架,由一名主规划代理与多个设定人口属性的市民代理协同,通过多轮自然语言协商生成社区级土地利用图;该框架结合GPT模型的对话能力与空间映射机制,实现对多主体偏好的交互式响应。
在道路与地块层面,Hartmann等[51]最早将GAN应用于街道网络生成,并通过街区面积、紧凑度、长宽比等统计指标进行形态评估。为提升预测精度,Fang等[28]引入PlanStreet和TopoStreet模型,将动态上下文信息纳入样本生成过程。林博等[29]结合波函数坍缩算法(wave function collapse, WFC)与图像回溯技术,构建街道结构与建筑布局,在温州市中央绿轴北延段项目中实现了方案模拟与优选。在更复杂地形或非规则用地条件下,开发CVAE-GAN补图算法支持街区尺度形态的逐步演化与局部调整[39],用于道路优化任务。
在建筑与街区肌理层面,生成模型被用于学习城市图像特征,实现风格迁移与空间肌理补全。刘德利等[52]以城市道路网络作为输入数据,训练pix2pix模型生成3类典型形态(独立型、网格型、围合型)的建筑布局,实现快速方案推演。在景观细分场景方面,吴一凡等[36]基于绿道场景构建“大数据-智能评价-微调生成”工作流,在SD框架下采用低秩自适应(low-rank adaptation, LoRA)参数高效微调与ControlNet条件控制网络,实现水体、铺装、树阵等要素的受控生成与现状重绘,流程侧重图层级控制。陈然等[53]基于StyleGAN2对风景园林方案图像进行定向生成,并通过特征向量聚类与降维分析提取水体、道路、绿地等要素的可控因子,用于方案变体生成与要素比例调节。Quan[54]提出Urban-GAN系统,结合图像聚类与DCGAN模型构建5种城市形态风格识别机制,可输出二维布局图与2.5D模型,并集成密度、连通性等性能指标,从而支持生成方案的筛选与修正。类似的,在历史城区保护设计中,以肌理分类标签与街区边界为输入,生成缺口区域的特定肌理图像,用于历史城区肌理的还原与延续[55]。Campo[56]使用深度卷积神经网络(Deep CNN)建模城市纹理特征,增强了微观空间组织的语义识别与还原能力。
三维形态建构方面,Kim等[57]首次尝试从单张街景图生成包含街道、建筑与植被的完整三维城市模型,融合了GAN的图像生成能力与CNN的空间特征识别机制,是一种从二维语义映射到三维重建的典型路径。为提升输出模型的真实感,Kelly等[58]引入多尺度细节特征作为输入条件,增强模型在复杂结构表达方面的细节控制力。在社区尺度上,Yu[59]采用pix2pix网络生成彩色编码掩膜图,用于布局重建与再设计。Deng等[60]提出的CityCraft框架结合DiT模型(denoising diffusion transformer)与LLM(如GPT),先生成二维草图,再自动生成地块划分与规划策略,实现从样本学习到语义指令驱动的三维生成路径。类似系统结合传统渲染器与嵌入式机器学习模块,基于城市滨水样本的建筑肌理学习加速街区形态生成,使输出更契合场地特征[61]

3.3 评估优化与决策

方案的评估、筛选与多目标优化是实现GAI设计可实施性与决策支持的关键环节。AI在优化算法、性能模拟、偏好调节等方面的能力不断增强,推动在城市设计中从静态产出向多轮反馈和性能导向的动态优化发展。
在方案评价中,pix2pix、CycleGAN与城市天气生成器模型(urban weather generator, UWG)结合,被用于评估三维城市热环境表现,揭示不同立面密度与覆盖率组合对夜间热滞留的显著影响,为热岛缓解导向的形态优化提供依据[62]。甘惟等[61]则引入强化学习与视线模拟系统,通过自动分析视线通达性进行滨水街区的性能反馈与形态调整。高云帆等[25]构建基于GPT-4的选址推荐系统,结合GeoBERT与协同过滤模型,生成多候选点的排序推荐并提供评分解释机制,提升了系统推荐的可用性与可解释性。此外,LIM-SD将SD与景观信息模型联动,对河滨湿地场景的生成结果以专家评审维度与参数化指标进行成体系评估,指标覆盖植被覆盖率与近水岸比例等与绿地系统/滨水带配置直接相关的景观要素[63]
在多目标优化与迭代模型中,早期的演化优化模型与大语言模型共同发挥重要作用。Yu等[30]提出结合ChatGPT与人工蜂群算法的低碳城市更新方法,GPT用于生成策略文本,优化算法则负责基于碳排放与资源效率的性能评估与解空间搜索。Zhou等[26]开发基于大语言模型的多角色Agent协作系统,模拟规划师与居民之间的多轮语言交互,逐步生成并调整土地利用方案,实现了从文本生成到空间配置的迭代优化流程。另有研究提出基于GANxGAN的生成设计方法,结合热舒适性模拟与可步行性分析,通过多目标优化迭代生成城市凉感空间,显著提升高温日的局地气候表现与步行连贯性[64]
生成模型也被用于城市扩张与功能演化的趋势模拟,支撑空间决策与政策评估。Sun等[65]训练基于历史土地变化的模型,预测深圳市未来的用地布局,提供长期空间发展评估支持。Liu等则提出结合案例学习与规则优化的城市形态生成系统,模拟历史演化过程并支持在具体指标约束下进行原型推演,适用于规划阶段的结构优化与趋势判断[66]。周臻等[67]则提出MT-GPT模型,将大语言模型与多任务学习结合,构建结构化的多模式交通系统大模型,支持从交叉口节点到城市网络整体的规划分析与仿真。

3.4 效果表达

城市设计方案的呈现需要以直观、生动的方式促进公众理解、专家反馈与跨界沟通,GAI在图像、文本和设计成果表达等方面的能力,正在重塑设计表达方式,推动其向更高效、更自动化的方向演进。
在设计文本生成方面,GPT等语言大模型已被用于辅助规划文书撰写与知识问答。Zhu等[68]提出的PlanGPT系统在GPT微调基础上实现,结合多源检索与知识库,支持术语解释、文本校对、报告撰写等任务,体现了大模型在规划成果语言表达与协同沟通环节的拓展应用。
平面图纸生成则更多结合计算机视觉模型完成从草图或图像到CAD图的转译。Sharma等[69]利用CNN构建从手绘草图提取CAD平面图的算法流程;小库AI云也已集成图像转CAD模块,提升了草图数字化效率[70]。Ye等[71]则在5 000张总平面图数据集上训练自定义GAN网络,实现对规划图纸的自动着色。
图像表达与视觉渲染是生成模型应用最广泛的方向之一。文本驱动图像生成模型如MidJourney、DALL·E与SD被广泛用于建筑与城市氛围渲染。其中SD凭借较强的结构控制能力,在效果图补全与真实场景融合方面展现出明显优势。一些研究引入LoRA微调方法以进一步提升可控性与本地适应性,例如在风貌图像生成系统构建中,通过输入定量指标与语义假设预测街景形态[23];在广州白鹅潭片区的实验中,则采用微调后的SD模型结合图层蒙版与提示词,生成具有地域特色的滨水风貌图像[24]。Huang等[63]将语义提示与SD接入景观信息模型(landscape information modeling, LIM)的地形-水体-用地图层与植物库,实现可分层编辑的种植配置与带状绿带生成,用于滨河湿地场景的方案表达;并结合LIM的统计模块对绿地系统进行量化复核(如植被覆盖率、近水岸比例),增强方案比选与呈现。在更高层次上,UrbanWorld系统结合三维扩散生成模型(3D Diffusion)与MLLM,实现语义增强与城市资产渲染,支持场景语义分层与真实感表达[49]。此外,一些商业化平台也在推动该类技术的专业化应用。例如小库科技推出的小库云平台,依托自建的ArchiNet数据库,集成CNN、GAN与RL模型,提升了图像输出的可控性与针对性[70]。以及将SD与LoRA微调机制封装为设计软件插件,如SUAPP AI等,实现了建筑与城市视觉表达任务中的轻量集成与本地化部署路径[72]

4 讨论

4.1 GAI在城市设计中的作用机制与应用逻辑

本研究将当前主流的GAI模型划分为4类:图像驱动模型、结构驱动模型、语言驱动模型与反馈优化模型。它们在介入逻辑与任务阶段上各具特征,并非仅由技术成熟度划分,而是基于模型能力与任务特征之间的匹配关系进行组合选用。
图像驱动生成模型擅长处理非结构化的视觉信息,主要用于方案构图、风貌表达与感性意象生成,嵌入方案生成与效果表达环节。结构驱动生成模型通过图神经网络、邻接规则或空间语法建模等方法构建空间拓扑结构,适用于街道网络、地块划分等形态生成任务。语言驱动生成模型可将自然语言输入转化为策略参数,用于前期分析、公众交互与任务构建。反馈优化生成模型则借助强化学习、进化算法与多目标优化方法,支撑方案优化与复杂决策,常用于评估优化与后期迭代。这些模型在城市设计流程中并非按阶段分工依次调用,而是根据任务目标、输入模态与设计目标进行交叉嵌套与协同耦合。
从整体角色来看,当前GAI在城市设计中仍主要体现为“AI辅助型”与“AI增强型”的应用形态。具体来说,现阶段生成模型所提供的多数功能(如草图到概念方案的快速生成、风貌效果表达、设计方案扩展等),实质上基于对既有数据和规则的过程式(procedural)组合,而非真正意义上的生成式(generative)建构。因此,这类工具的作用主要体现在效率提升、方案扩展与快速反馈响应层面,本质上仍未实现自主的设计逻辑建构与创造性决策能力。因此其角色始终是设计师的协作者或辅助者,而非具备主导性创造力的独立主体。这一现状意味着设计师的创意和判断仍是不可或缺的,AI工具更多发挥的是激发潜力、扩展可能性的支持性作用,而非取代设计师的设计决策。本研究将人与AI协作的必要条件界定为“可控性、可观测性、可追溯性”:即关键参数与约束须可明确设定与局部调整(可控性),中间过程与依据可被查看与核查(可观测性),输出与输入的数据、规则之间可被追溯与解释(可追溯性),以确保“人主导-AI协作/增强”的边界清晰、责任明确。

4.2 当前局限与未来趋势

尽管GAI在城市设计中的应用不断拓展,其在技术逻辑、数据基础与社会接受度方面仍存在显著瓶颈。这些瓶颈与技术接受程度之间存在内在关联,共同影响GAI技术的规模化采纳与有效应用。
首先,模型生成结果的可靠性问题仍未得到有效解决。受限于数据偏差与语义对齐不足,目前模型仍会生成违背物理规律或规划规范的方案,形成所谓的“幻觉”问题。这一问题在缺乏城市设计领域专有知识嵌入的通用模型中尤其严重,亟待通过领域自适应训练(domain adaptation)和规则约束模块予以缓解。
其次,模型的黑箱特征及可解释性不足阻碍了GAI技术的广泛接受。城市设计的决策过程需要明确的逻辑路径支撑。当前深度生成模型的“黑箱”特性使设计师难以追溯生成逻辑,从而削弱了设计师对关键方案的信任度与接受意愿。尽管可解释人工智能 (explainable artificial intelligence, XAI)技术如注意力机制、因果分析逐渐被引入,但在复杂空间生成任务中的解释粒度仍显粗糙,难以满足实践需求。这种低解释性直接影响了不同GAI技术类型的实际接受程度。为解释由可解释性不足引发的采纳差异,笔者在此引入技术接受模型(technology acceptance model, TAM)的感知有用性(perceived usefulness,PU)/感知易用性(perceived ease of use, PEU)视角进行基于文本证据分级的描述性分析
具体而言,基于对已纳入文献的描述性TAM分析,发现:模型的PU与PEU与实际采纳存在关联性迹象。总体上,图像驱动模型因输出直观、易理解、上手门槛较低,通常呈现较高的PU与中-高的PEU,因此率先进入原型表达与早期生成场景;语言驱动模型的PU大体为中等,其早期PEU受自然语言技术成熟度所限而偏低,近年随模型能力提升与工具链完善而呈上升趋势;结构驱动模型与反馈优化模型在约束满足与多目标搜索上具备较高PU潜力,但由于管线复杂、参数与解释成本较高,PEU多为中-低,采纳范围相对受限。上述差异与可解释性/透明性不足呈相关关系:可解释性越弱,设计师对工具的可控感与信任度越低,进而压低PEU与采纳意愿。据此,未来工作除追求性能外,更应优先投入于易用性与透明性(如过程可视化、局部可控、约束可核查),以强化“解释性—可控性—信任—采纳”的因果链,并提升实际可用性。
最后,数据割裂与领域适应性不足仍是核心障碍。当前模型多依赖公开数据集,缺乏针对特定城市文化语境(如亚洲高密度街区)或规范体系(如日照间距)的定向训练。例如,SD生成的欧式街道肌理难以直接应用于中国街道布局。构建适用于中国城市的本土化数据库,以及结构化、地域化的城市设计知识图谱,或是突破这一瓶颈的关键基础。
针对上述局限,从长远趋势来看,GAI技术正呈现从技术性能优化向系统性、交互性、精细化范式转变的趋势,逐步破解当前瓶颈。
模型控制能力的精细化成为技术演进的关键方向。传统生成模型(如GAN)多以整体图像输出为主,缺乏局部调整和精细化控制能力,严重限制了模型在复杂、多尺度城市设计场景中的有效应用。而近年来ControlNet、分段生成技术、多尺度反馈机制等局部控制方法的引入,极大地提高了生成结果的可控性和实用性。
在人机协作模式上,MLLM技术的出现改变了传统设计流程静态的“输入—输出”范式,转而通过自然语言对话、意图解析与多模态交互,实现动态化、迭代化的人机交互。设计师的角色也随之从单纯的方案生产者转变为AI协同流程的引导者,通过多轮语言校准生成方案。这种多轮校准模式有望有效缓解生成模型黑箱化的负面影响,使设计师可通过连续、多步的对话明确调整生成逻辑和目标导向,从而提高了模型使用的可解释性、易用性与可信度。
在前述技术与交互模式的基础上,多模型协同工作流正逐步形成。已有研究探索将当前城市设计流程拆解为数据补全、形态生成、性能优化等模块,分别由图像驱动、语言驱动与反馈优化模型协同完成。这种模块化分工并非简单串联,而是通过跨模型数据流(如文本—图像—图结构转换)实现深度耦合,为从半自动化辅助向全流程生成演进奠定了基础,人类规划设计师则负责监督把关,确保整体流程逻辑与生成质量的合理性与可靠性。需要强调的是,多模型协同的收益具有情境依赖性:当任务仅涉及规范性核查或指标计算等、不含复杂结构约束时,单一模型或轻量级流水线即可胜任,系统级协同未必带来显著增益;而当任务需要跨模态信息传递,保持语义、几何、性能的一致性,或在多目标之间做全局权衡时,协同工作流的优势更易显现。
此外,GAI工具的轻量化与普及化显著拓宽了技术应用边界,扩大了使用群体范围。插件化部署与云端训练平台降低了专业门槛,一方面,提高了城市设计工作流的整体效率,加快设计方案的开发与评估周期;另一方面,使规划部门、社区团体乃至普通公众能够直接参与到生成设计过程中。公众参与范围的扩大与使用便捷性的提升,进一步推动技术接受度的广泛提高。

5 结论

本研究围绕GAI在城市设计领域中的典型应用展开系统性综述,在遵循PRISMA流程的基础上,共纳入125篇相关文献。通过对比模型输入类型、生成目标与任务嵌入方式,笔者提出将现有GAI方法归纳为图像驱动、语言驱动、结构驱动与反馈优化4类,并结合设计思维理论梳理城市设计的阶段性流程,构建了“GAI技术类型×城市设计任务阶段”的二维分析框架。
本研究发现,相比于单一任务工具,GAI多模型协同工作流在近年呈上升态势。图像驱动模型因高可用性与易用性最早获得采纳,而语言、结构及反馈优化模型则在任务复杂度、数据适应性与控制能力方面展现出潜力。结合TAM的描述性视角,不同类型模型在感知有用性与易用性方面的差异影响应用比例,这提示未来技术发展应兼顾性能提升与使用便捷性。当前主要瓶颈包括可控性不足、解释能力有限、缺乏地域性语义建构与规范嵌入,亟须在结构化数据建设与跨尺度模型控制等方面取得突破。
需要指出的是,出于综述研究的规范性与质量控制要求,本研究主要聚焦于同行评议文献与高质量研究论文,尽管纳入了部分关注度较高的行业白皮书/项目报告与arXiv高被引预印本,但鉴于此类材料体量庞大且更新快速,未对其开展面向全体的系统性筛选,可能存在遗漏与选择偏倚,构成一定的局限。
未来研究应聚焦于3方面突破:1)构建结构化、地域化的城市设计数据库体系,以提升模型泛化能力与适应性;2)开发可控、可解释的生成机制,缓解“黑箱化”问题;3)推进多模型协同机制,构建从工具向系统演化的智能设计框架。
综上所述,GAI在城市设计中已展现出重构流程逻辑与拓展设计工具体系的广阔前景。这种由“工具辅助”向“人机协作”的演进趋势正在为城市设计注入新的智能动能,也对设计师角色与方法体系提出更新要求。本研究所提出的分析框架与路径梳理可为后续研究提供系统参考,助力城市智能设计实践的深化发展。

1 见本刊官网该文章资源附件附表1 名词解释

2 见本刊官网该文章资源附件附表2 样本清单。

3 见本刊官网该文章资源附件附表3 模型×PU/PEU证据分级。

图表来源(Sources of Figures and Tables):

文中图表均由作者绘制。

文章亮点

1、聚焦生成式人工智能(GAI)在城市设计中的应用研究,按PRISMA流程纳入125篇中英文文献,系统覆盖近3年代表性新模型的应用证据。

2、构建“GAI技术类型×城市设计阶段”二维框架,归纳图像、语言、结构、反馈优化4类生成模型,结合设计思维明确各阶段的介入逻辑与功能定位。

3、引入技术接受模型(TAM)量化不同技术模型采纳差异。据此提出3条改进路径:本土化数据、可解释与可控、多模型协同,支撑实践落地与后续研究。

[1]
LYNCH K. The Image of the City: Image of the City[M]. Cambridge: MIT Press, 1960.

[2]
JACOBS J. The Death and Life of Great American Cities[M]. New York: Vintage, 1992.

[3]
GEHL J. Cities for People[M]. Washington, D.C.: Island Press, 2010.

[4]
STEINER F R, BUTLER K, AMERICAN PLANNING ASSOCIATION. Planning and Urban Design Standards[M]. Student Edition. Hoboken: JOHN WILEY & SONS, INC., 2012.

[5]
PARISH Y I H, MÜLLER P. Procedural Modeling of Cities[C]//SIGGRAPH. Proceedings of the 28th Annual Conference on Computer Graphics and Interactive Techniques. New York: Association for Computing Machinery, 2001: 301-308.

[6]
HERR C M, KVAN T Adapting Cellular Automata to Support the Architectural Design Process[J]. Automation in Construction, 2007, 16 (1): 61.-69.

DOI

[7]
BATTY M Artificial Intelligence and Smart Cities[J]. Environment and Planning B: Urban Analytics and City Science, 2018, 45 (1): 3.-6.

DOI

[8]
吴志强, 黄晓春, 李栋, 等 “人工智能对城市规划的影响”学术笔谈会[J]. 城市规划学刊, 2018 (5): 1.-10.

WU Z Q, HUANG X C, LI D, et al Symposium on “Artificial Intelligence and Its Impacts on Urban Planning”[J]. Urban Planning Forum, 2018 (5): 1.-10.

[9]
KARRAS T, LAINE S, AILA T A Style-Based Generator Architecture for Generative Adversarial Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2021, 43 12 4217.-4228.

DOI

[10]
华为企业业务.国地科技与华为发布国土空间规划AI一体机联合解决方案, 助力自然资源行业数智化转型[EB/OL].(2025-03-14)[2025-03-27]. https://e.huawei.com/cn/news/2025/industries/government/ai-machines-territorial-spatial-planning.

Huawei Enterprise Business. Guodi Technology and Huawei Released the Joint Solution for Territorial Spatial Planning AI Integrated Machine, Facilitating the Digital and Intelligent Transformation of the Natural Resources Industry[EB/OL]. (2025-03-14)[2025-03-27]. https://e.huawei.com/cn/news/2025/industries/government/ai-machines-territorial-spatial-planning.

[11]
JIANG F F, MA J, WEBSTER C J, et al Generative Urban Design: A Systematic Review on Problem Formulation, Design Generation, and Decision-Making[J]. Progress in Planning, 2024, 180: 100795.

DOI

[12]
SANCHEZ T W, FU X Y, YIGITCANLAR T, et al The Research Landscape of AI in Urban Planning: A Topic Analysis of the Literature with ChatGPT[J]. Urban Science, 2024, 8 (4): 197.

DOI

[13]
LIN B, JABI W, CORCORAN P, et al The Application of Deep Generative Models in Urban Form Generation Based on Topology: A Review[J]. Architectural Science Review, 2024, 67 (3): 189.-204.

DOI

[14]
OZTURK G B, SOYGAZI F. Generative AI Use in the Construction Industry[M]//LYU Z H. Applications of Generative AI. Cham: Springer International Publishing, 2024: 161-187.

[15]
XIA J H, TONG Y, LONG Y Advancements in the Application of Large Language Models in Urban Studies: A Systematic Review[J]. Cities, 2025, 165: 106142.

DOI

[16]
MOHER D, LIBERATI A, TETZLAFF J, et al Preferred Reporting Items for Systematic Reviews and Meta-analyses: The PRISMA Statement[J]. PLoS Medicine, 2009, 6 (7): e1000097.

DOI

[17]
WANG J, BILJECKI F Unsupervised Machine Learning in Urban Studies: A Systematic Review of Applications[J]. Cities, 2022, 129: 103925.

DOI

[18]
VASWANI A, SHAZEER N, PARMAR N, et al. Attention Is All You Need[C]//NIPS. Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook: Curran Associates Inc., 2017, 30.

[19]
HUANG W X, ZHENG H. Architectural Drawings Recognition and Generation Through Machine Learning[J]. Proceedings of the 38th Annual Conference of the Association for Computer Aided Design in Architecture (ACADIA), 2018: 156-165.

[20]
RADFORD A, METZ L, CHINTALA S, et al. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks[EB/OL]. (2015-11-19)[2025-03-01]. https://arXiv.org/abs/1511.06434.

[21]
KEMPINSKA K, MURCIO R Modelling Urban Networks Using Variational Autoencoders[J]. Applied Network Science, 2019, 4 (1): 114.

DOI

[22]
CROITORU F A, HONDRU V, IONESCU R T, et al Diffusion Models in Vision: A Survey[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2023, 45 (9): 10850.-10869.

DOI

[23]
王天莲 基于人工智能生成技术的城市街道空间感知与未来风貌预测[J]. 城市发展研究, 2024, 31 (2): 9.-14.

WANG T L Urban Street Space Sensibility and Future Styles Prediction Based on AIGC Technology[J]. Urban Development Studies, 2024, 31 (2): 9.-14.

[24]
陈昱宇, 何铭, 袁磊, 等 基于AIGC的城市滨水区特色风貌营造研究: 以广州白鹅潭片区为例[J]. 城市建筑, 2025, 22 (4): 11.-13,78.

CHEN Y Y, HE M, YUAN L, et al Research on the Construction of Urban Waterfront Characteristic Landscape Based on AIGC: A Case of Bai’etan District in Guangzhou[J]. Urbanism and Architecture, 2025, 22 (4): 11.-13,78.

[25]
高云帆, 郁董卿, 王思琪, 等 大语言模型驱动的选址推荐系统[J]. 计算机研究与发展, 2024, 61 (7): 1681.-1696.

GAO Y F, YU D Q, WANG S Q, et al Large Language Model Powered Site Selection Recommender System[J]. Journal of Computer Research and Development, 2024, 61 (7): 1681.-1696.

[26]
ZHOU Z L, LIN Y M, LI Y, et al. Large Language Model Empowered Participatory Urban Planning[EB/OL]. (2024-01-24)[2025-03-01]. https://arXiv.org/abs/2402.01698.

[27]
郑雨豪, 王森章 基于扩散模型的不完整数据下细粒度城市流量推断[J]. 智能科学与技术学报, 2023, 5 (3): 389.-396.

ZHENG Y H, WANG S Z Fine-Grained Urban Flow Inference Based on Diffusion Models with Incomplete Data[J]. Chinese Journal of Intelligent Science and Technology, 2023, 5 (3): 389.-396.

[28]
FANG Z, QI J X, FAN L B, et al A Framework for Human-Computer Interactive Street Network Design Based on a Multi-stage Deep Learning Approach[J]. Computers, Environment and Urban Systems, 2022, 96: 101853.

DOI

[29]
林博, 刁荣丹, 吴依婉 基于人工智能的城市空间生成设计框架: 以温州市中央绿轴北延段为例[J]. 规划师, 2019, 35 17 44.-50.

LIN B, DIAO R D, WU Y W Urban Space Generative Design Based on Artificial Intelligence: Northern Extension of Central Green Axis, Wenzhou[J]. Planners, 2019, 35 17 44.-50.

[30]
YU S H, YANG Y, LI J M, et al Exploring Low-Carbon and Sustainable Urban Transformation Design Using ChatGPT and Artificial Bee Colony Algorithm[J]. Humanities and Social Sciences Communications, 2024, 11: 252.

DOI

[31]
RITTEL H W J, WEBBER M M Dilemmas in a General Theory of Planning[J]. Policy Sciences, 1973, 4 (2): 155.-169.

DOI

[32]
甘惟, 吴志强, 王元楷, 等 AIGC辅助城市设计的理论模型建构[J]. 城市规划学刊, 2023 (2): 12.-18.

GAN W, WU Z Q, WANG Y K, et al AIGC Assisted Urban Design: A Theoretical Model[J]. Urban Planning Forum, 2023 (2): 12.-18.

[33]
陈然, 罗晓敏, 何越衡, 等 生成式算法在风景园林生成设计中的适应性研究[J]. 风景园林, 2024, 31 (9): 12.-23.

DOI

CHEN R, LUO X M, HE Y H, et al Research on the Adaptability of Generative Algorithm in Generative Landscape Design[J]. Landscape Architecture, 2024, 31 (9): 12.-23.

DOI

[34]
ZHANG Y, KWAN M P, FANG L B An LLM Driven Dataset on the Spatiotemporal Distributions of Street and Neighborhood Crime in China[J]. Scientific Data, 2025, 12: 467.

DOI

[35]
广州市规划和自然资源局. DeepSeek如何赋能?多位大咖齐聚开麦[EB/OL].(2025-03-21)[2025-03-27]. https://mp.weixin.qq.com/s/YpfF-rJ_VREUeK0FfFRskQ.

Guangzhou Municipal Planning and Natural Resources Bureau. How DeepSeek Empowers Urban Planning: Insights from Experts[EB/OL]. (2025-03-21)[2025-03-27]. https://mp.weixin.qq.com/s/YpfF-rJ_VREUeK0FfFRskQ.

[36]
吴一凡, 孟露, 李倞 基于网络大数据与人工智能生成内容(AIGC)微调模型的绿道辅助设计路径[J]. 风景园林, 2025, 32 (7): 96.-105.

DOI

WU Y F, MENG L, LI L Aided Greenway Design Approach Based on Internet Big Data and AIGC Fine-Tuning Model[J]. Landscape Architecture, 2025, 32 (7): 96.-105.

DOI

[37]
城市象限.社绘AI: 大模型时代的城市更新公众参与工具[EB/OL].(2024-12-21)[2025-03-27]. https://mp.weixin.qq.com/s/hdeJ_BJp2XynB4XWajmLEw.

City Quadrant. Shehui AI: A Public Participation Tool for Urban Renewal in the Era of Large Models[EB/OL]. (2024-12-21)[2025-03-27]. https://mp.weixin.qq.com/s/hdeJ_BJp2XynB4XWajmLEw.

[38]
WILSON K. This Artificial Intelligence Bot Is Designing Better Streets than Some Engineers[EB/OL]. (2022-07-28)[2025-03-21]. https://usa.streetsblog.org/2022/07/28/this-artificial-intelligence-bot-is-designing-better-streets-than-some-engineers/.

[39]
杨俊宴, 朱骁 人工智能城市设计在街区尺度的逐级交互式设计模式探索[J]. 国际城市规划, 2021, 36 (2): 7.-15.

YANG J Y, ZHU X Exploration of the Step-by-Step Interactive Design Mode of Artificial Intelligence Urban Design at the Block Scale[J]. Urban Planning International, 2021, 36 (2): 7.-15.

[40]
ZHAO B, ZHANG S Z, XU C X, et al Deep Fake Geography? When Geospatial Data Encounter Artificial Intelligence[J]. Cartography and Geographic Information Science, 2021, 48 (4): 338.-352.

DOI

[41]
TANG H, XU D, YAN Y, et al. Local Class-Specific and Global Image-Level Generative Adversarial Networks for Semantic-Guided Scene Generation[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Seattle: IEEE, 2020: 7867-7876.

[42]
BITTNER K, D’ANGELO P, KÖRNER M, et al. Automatic Large-Scale 3D Building Shape Refinement Using Conditional Generative Adversarial Networks[J]. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences, 2018, XLII-2: 103-108.

[43]
GARCÍA DE SOTO D B, STREULE T, KLIPPEL M, et al Improving the Planning and Design Phases of Construction Projects by Using a Case-Based Digital Building System[J]. International Journal of Construction Management, 2020, 20 (8): 900.-911.

DOI

[44]
JOHNSEN M, BRANDT O, GARRIDO S, et al Population Synthesis for Urban Resident Modeling Using Deep Generative Models[J]. Neural Computing and Applications, 2022, 34 (6): 4677.-4692.

DOI

[45]
PARK J S, O’BRIEN J, CAI C J, et al. Generative Agents: Interactive Simulacra of Human Behavior[C]//Proceedings of the 36th Annual ACM Symposium on User Interface Software and Technology. San Francisco: ACM, 2023: 1-22.

[46]
YAN Y B, WEN H M, ZHONG S R, et al. UrbanCLIP: Learning Text-Enhanced Urban Region Profiling with Contrastive Language-Image Pretraining from the Web[C]//Proceedings of the ACM Web Conference 2024. Singapore: ACM, 2024: 4006-4017.

[47]
DANCHENKO E. The AI-Teration Method and the Role of AI in Architectural Design[C]//ARAI K, KAPOOR S, BHATIA R. Proceedings of the Future Technologies Conference (FTC) 2020: Volume 1. Cham: Springer, 2021: 525-538.

[48]
JARUGA-ROZDOLSKA A Artificial Intelligence as Part of Future Practices in the Architect’s Work: MidJourney Generative Tool as Part of a Process of Creating an Architectural Form[J]. Architectus, 2022, 3 71 95.-104.

[49]
SHANG Y, LIN Y M, ZHENG Y, et al. UrbanWorld: An Urban World Model for 3D City Generation[EB/OL]. (2024-07-16)[2025-03-01]. https://arXiv.org/abs/2407.11965.

[50]
ALBERT A, STRANO E, KAUR J, et al. Modeling Urbanization Patterns with Generative Adversarial Networks[C]//IGARSS 2018 - 2018 IEEE International Geoscience and Remote Sensing Symposium. Valencia. IEEE, 2018: 2095-2098.

[51]
HARTMANN S, WEINMANN M, WESSEL R, et al. StreetGAN: Towards Road Network Synthesis with Generative Adversarial Networks[EB/OL].[2025-03-27]. https://cg.cs.uni-bonn.de/publication/hartmann-2017-streetgan.

[52]
刘德利, 王科奇 基于pix2pix算法的建筑形态及其组合生成式设计研究[J]. 建筑科学, 2022, 38 10 260.-267.

LIU D L, WANG K Q Research on the Generative Design of Architectural Form and Combination Based on Pix2Pix Algorithm[J]. Building Science, 2022, 38 10 260.-267.

[53]
陈然, 赵晶 基于样式生成对抗网络的风景园林方案生成及设计特征识别[J]. 风景园林, 2023, 30 (7): 12.-21.

CHEN R, ZHAO J Generation and Design Feature Recognition of Landscape Architecture Scheme Based on Style-Based Generative Adversarial Network[J]. Landscape Architecture, 2023, 30 (7): 12.-21.

[54]
QUAN S J Urban-GAN: An Artificial Intelligence-Aided Computation System for Plural Urban Design[J]. Environment and Planning B: Urban Analytics and City Science, 2022, 49 (9): 2500.-2515.

DOI

[55]
刘宇波, 胡凯, 邓巧明 人工智能辅助的“基于案例设计”: 以深圳南头古城周边地区城市肌理织补为例[J]. 南方建筑, 2023 10 20.-27.

LIU Y B, HU K, DENG Q M Artificial Intelligence-Assisted Case-Based Design: A Case Study on Urban Texture Darning Surrounding the Ancient City of Nantou in Shenzhen[J]. South Architecture, 2023 10 20.-27.

[56]
DEL CAMPO M Architecture, Language and AI - Language, Attentional Generative Adversarial Networks (AttnGAN) and Architecture Design[J]. Proceedings of the 26th Conference on Computer Aided Architectural Design Research in Asia (CAADRIA), 2021, 1: 211.-220.

[57]
KIM S, PARK S, KIM H, et al Deep Floor Plan Analysis for Complicated Drawings Based on Style Transfer[J]. Journal of Computing in Civil Engineering, 2021, 35 (2): 04020066.

DOI

[58]
KELLY T, GUERRERO P, STEED A, et al FrankenGAN: Guided Detail Synthesis for Building Mass Models Using Style-Synchonized GANs[J]. ACM Transactions on Graphics, 2018, 37 (6): 1.-14.

[59]
YU D. Reprogramming Urban Block by Machine Creativity: How to Use Neural Networks as Generative Tools to Design Space[C]//WERNER L C, KOERING D. Anthropologic – Architecture and Fabrication in the Cognitive Age: Proceedings of the 38th International Conference on Education and Research in Computer Aided Architectural Design in Europe. Berlin: eCAADe, 2020: 249-258.

[60]
DENG J, CHAI W H, HUANG J S, et al. CityCraft: A Real Crafter for 3D City Generation[EB/OL]. (2024-06-07)[2025-03-01]. https://arXiv.org/abs/2406.04983.

[61]
甘惟, 王元楷, 李翔 嵌入式机器学习方法在街区形态生成设计中的应用探索[J]. 西部人居环境学刊, 2024, 39 (3): 1.-7.

GAN W, WANG Y K, LI X Practical Study on the Application of Embedded Machine Learning Method in Generative Design at Block Level[J]. Journal of Human Settlements in West China, 2024, 39 (3): 1.-7.

[62]
WANG M, XIONG Z H, ZHOU S Q, et al Integrating Generative AI and Climate Modeling for Urban Heat Island Mitigation[J]. Ecological Informatics, 2025, 90: 103284.

DOI

[63]
黄焱, 李天劼 基于景观信息模型-稳定扩散模型(LIM-SD)方法的生态工程景观设计效能评估: 以城市滨河湿地为例[J]. 景观设计学(中英文), 2024, 12 (5): 68.-81.

DOI

HUANG Y, LI T J Design Efficacy Evaluation of a Landscape Information Modeling-Stable Diffusion(LIM-SD)-Based Approach for Ecological Engineered Landscaping Design: A Case Study of an Urban River Wetland[J]. Landscape Architecture Frontiers, 2024, 12 (5): 68.-81.

DOI

[64]
LI X Q, LU W S, PENG Z Y, et al Generative Design of Walkable Urban Cool Spots Using a Novel Heuristic GAN×GAN Approach[J]. Building and Environment, 2024, 266: 112027.

DOI

[65]
SUN S T, MU L, FENG R Y, et al GAN-Based LUCC Prediction via the Combination of Prior City Planning Information and Land-Use Probability[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2021, 14: 10189.-10198.

DOI

[66]
LIU Y B, HU K, DENG Q M Evolvable Case-Based Design: An Artificial Intelligence System for Urban Form Generation with Specific Indicators[J]. Environment and Planning B: Urban Analytics and City Science, 2024, 51 (8): 1742.-1757.

DOI

[67]
周臻, 顾子渊, 曲小波, 等 城市多模式交通大模型MT-GPT: 点线面的分层技术与应用场景[J]. 中国公路学报, 2024, 37 (2): 253.-274.

ZHOU Z, GU Z Y, QU X B, et al Urban Multimodal Transportation Generative Pretrained Transformer Foundation Model: Hierarchical Techniques and Application Scenarios of Spot-Corridor-Network Decomposition[J]. China Journal of Highway and Transport, 2024, 37 (2): 253.-274.

[68]
ZHU H, ZHANG W J, HUANG N X, et al. PlanGPT: Enhancing Urban Planning with Tailored Language Model And Efficient Retrieval[EB/OL]. (2024-02-29) [2025-03-01]. https://arxiv.org/abs/2402.19273.

[69]
SHARMA D, GUPTA N, CHATTOPADHYAY C, et al. REXplore: A Sketch Based Interactive Explorer for Real Estates Using Building Floor Plan Images[C]//2018 IEEE International Symposium on Multimedia. Taichung. [S.L.]: IEEE, 2019: 61-64.

[70]
小库AI.灵感广场[EB/OL].(2024-05-04)[2025-03-04]. https://cloud.xkool.ai/pc/muse.

XKOOL. Muse Gallery[EB/OL]. (2024-05-04)[2025-03-04]. https://cloud.xkool.ai/pc/muse.

[71]
YE X Y, DU J X, YE Y MasterplanGAN: Facilitating the Smart Rendering of Urban Master Plans via Generative Adversarial Networks[J]. Environment and Planning B: Urban Analytics and City Science, 2022, 49 (3): 794.-814.

DOI

[72]
灵感AI.灵感AI官网[EB/OL].(2024-05-04)[2025-03-04]. https://ai.suapp.com/.

SUAPP AI. SUAPP AI Official Website[EB/OL]. (2024-05-04)[2025-03-04]. https://ai.suapp.com.

文章导航

/