【作者】
張業(yè)成a,?, 趙慧敏,?, 龍瀛,*
a ,b 清華大學(xué)建筑學(xué)院
c 清華大學(xué)建筑學(xué)院和恒隆房地產(chǎn)研究中心,教育部生態(tài)規(guī)劃與綠色建筑重點(diǎn)實(shí)驗(yàn)室
?共同第一作者
通訊作者郵箱
ylong@tsinghua.edu.cn
原文鏈接
https://www.nature.com/articles/s41597-025-04730-5
內(nèi)容導(dǎo)讀
快速獲取三維(3D)建筑數(shù)據(jù),包括屋頂、高度和結(jié)構(gòu)等幾何屬性,以及功能、質(zhì)量和年齡等指標(biāo)屬性,對(duì)于準(zhǔn)確的城市分析、模擬和政策更新至關(guān)重要。當(dāng)前的建筑物數(shù)據(jù)集存在多維屬性時(shí)空覆蓋缺失。龍瀛課題組開(kāi)發(fā)了一個(gè)用于大規(guī)模建筑建模的人工智能框架(圖1),提出了第一個(gè)國(guó)家規(guī)模的多屬性建筑物數(shù)據(jù)集CMAB,覆蓋了中國(guó)3667個(gè)實(shí)體城市,3100萬(wàn)個(gè)建筑和236億m2的屋頂,在基于OCRNet的提取中F1值為89.93%,總計(jì)3630億m3的建筑存量。基于城市行政等級(jí)分類(lèi)訓(xùn)練了機(jī)器學(xué)習(xí)模型,包含形態(tài)、區(qū)位和功能等特征。使用多源數(shù)據(jù),包括數(shù)10億張高分辨率遙感圖像和6000萬(wàn)張街景圖像,通過(guò)深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和多模態(tài)大模型為每棟建筑生成了屋頂、高度、結(jié)構(gòu)、功能、風(fēng)格、年齡和質(zhì)量屬性。準(zhǔn)確性通過(guò)模型基準(zhǔn)、現(xiàn)有的類(lèi)似產(chǎn)品和人工檢查進(jìn)行了驗(yàn)證,準(zhǔn)確率超過(guò)80%。數(shù)據(jù)集和結(jié)果對(duì)于全球可持續(xù)發(fā)展目標(biāo)和城市規(guī)劃至關(guān)重要。
圖1 CMAB的整體建模框架
研究背景
在過(guò)去幾十年的城市化進(jìn)程中,世界各地的城市經(jīng)歷了快速擴(kuò)張,建筑物成為空間基本細(xì)胞單元,城市在三維形態(tài)和社會(huì)功能方面呈現(xiàn)出日益復(fù)雜的變化。通過(guò)構(gòu)建數(shù)據(jù)集全面了解城市的精細(xì)三維物理和社會(huì)結(jié)構(gòu),對(duì)于研究城市化進(jìn)程、城市能源、城市生態(tài)系統(tǒng)以及與碳排相關(guān)的政府決策至關(guān)重要。建筑屬性可以大致分為兩類(lèi):幾何屬性,包括建筑二維形態(tài)、高度、結(jié)構(gòu)和方位;和指標(biāo)屬性,包括功能、風(fēng)格、年齡、質(zhì)量和空置。幾何屬性對(duì)于分析城市物理結(jié)構(gòu)和規(guī)劃城市空間至關(guān)重要,而指標(biāo)屬性是理解建筑性能和生命周期的關(guān)鍵。
一方面,由于以往數(shù)據(jù)的空間和時(shí)間分辨率不足、訓(xùn)練樣本有限以及訓(xùn)練成本高昂,三維城市形態(tài)信息由于測(cè)繪成本和技術(shù)限制一直難以大規(guī)模展開(kāi),尤其是在發(fā)展中國(guó)家。因?yàn)閭鹘y(tǒng)航空測(cè)量經(jīng)濟(jì)成本高、時(shí)間長(zhǎng),使用開(kāi)源數(shù)據(jù)快速提取三維建筑數(shù)據(jù)是未來(lái)的發(fā)展趨勢(shì)。另一方面,目前對(duì)城市結(jié)構(gòu)的理解仍主要停留在物理層面,以現(xiàn)有的建筑屋頂和高度數(shù)據(jù)為代表,缺乏建筑物的綜合社會(huì)屬性,如功能、風(fēng)格、年齡和質(zhì)量。據(jù)調(diào)查,CMAB是世界上第一個(gè)在建筑單體層面提供這些屬性的國(guó)家規(guī)模的尺度開(kāi)放建筑物數(shù)據(jù)集。
圖2. 建筑屬性和數(shù)據(jù)來(lái)源可視化
主要解決問(wèn)題
1. 空間抽樣策略
首先定義實(shí)體城市的邊界,以明確數(shù)據(jù)產(chǎn)品的提取范圍。根據(jù)中國(guó)的氣候區(qū)劃和行政城市級(jí)別選擇建筑樣本,并將所有建筑物按照其對(duì)應(yīng)的行政級(jí)別分為五類(lèi)。
圖3. 中國(guó)實(shí)體城市抽樣、行政等級(jí)分類(lèi)與所用多源數(shù)據(jù)的空間完備性
圖4. 實(shí)體城市GES影像的時(shí)間分布
2. 構(gòu)建指標(biāo)體系,提取三維建筑
利用手工標(biāo)注增強(qiáng)的屋頂樣本來(lái)訓(xùn)練OCRNet模型,并采用空間聚合方法提取所有實(shí)體城市的建筑屋頂。在此基礎(chǔ)上,計(jì)算不同尺度下的建筑形態(tài)、密度和區(qū)位特征。針對(duì)每個(gè)行政級(jí)別的建筑,訓(xùn)練合適的分區(qū)模型以完成三維建筑的提取。同時(shí)在建筑高度的指標(biāo)體系上加入建筑功能特征。
圖5. 用于標(biāo)注增強(qiáng)的高密度區(qū)域重采樣過(guò)程
圖6. 百度建筑數(shù)據(jù)集的統(tǒng)計(jì)與預(yù)處理
圖7. 用于高度和功能估計(jì)的建筑物特征構(gòu)建
圖8. 建筑特征計(jì)算——以臨街和功能區(qū)位為例
3. 提取指標(biāo)屬性
使用多源數(shù)據(jù)進(jìn)一步提取不同尺度下的功能特征,生成功能特征。通過(guò)結(jié)合長(zhǎng)時(shí)序不透水面和6000萬(wàn)條街景圖像,通過(guò)空間匹配和目標(biāo)檢測(cè)為每個(gè)建筑單體分配建筑年代和質(zhì)量。此外,建筑的結(jié)構(gòu)、風(fēng)格屬性通過(guò)微調(diào)CLIP多模態(tài)模型獲得。
圖9. 通過(guò)街景評(píng)估沿街建筑的質(zhì)量
圖10. 使用GAIA數(shù)據(jù)為建筑物添加建筑年齡
4. 數(shù)據(jù)驗(yàn)證
對(duì)建筑的屋頂、高度和功能進(jìn)行了模型評(píng)估和數(shù)據(jù)對(duì)比,并通過(guò)手工標(biāo)注的街景數(shù)據(jù)集對(duì)建筑的高度、結(jié)構(gòu)、功能、風(fēng)格、質(zhì)量和年代進(jìn)行了驗(yàn)證。
圖11. 建筑物多屬性的人工驗(yàn)證方法
成效分析
1. 數(shù)據(jù)產(chǎn)品整體介紹
該數(shù)據(jù)集可在Figshare網(wǎng)站:https://doi.org/10.6084/m9.figshare.27992417獲得。該產(chǎn)品按實(shí)體城市和行政區(qū)劃組織,并以標(biāo)準(zhǔn)GIS格式保存。每個(gè)建筑物屋頂被保存為由地理坐標(biāo)系WGS1984下有限數(shù)量的點(diǎn)繪制的多邊形,包括建筑物屋頂、高度、結(jié)構(gòu)、功能、年齡、風(fēng)格和質(zhì)量作為建筑物屬性。
圖12. 北京多屬性建筑物數(shù)據(jù)集的可視化
2.建筑輪廓結(jié)果
評(píng)估基于一個(gè)驗(yàn)證集,包含來(lái)自七個(gè)不同氣候區(qū)的城市中23,415個(gè)手動(dòng)標(biāo)注的建筑屋頂。結(jié)果顯示,建筑屋頂分割模型在相關(guān)數(shù)據(jù)集上的交并比(mIoU)、召回率(Recall)和精度(Precision)方面優(yōu)于現(xiàn)有研究。在補(bǔ)充了114,783個(gè)建筑單體的標(biāo)注數(shù)據(jù)后,屋頂分割模型達(dá)到了91.59%的準(zhǔn)確率,81.95%的 mIoU,89.93%的 F1 分?jǐn)?shù),以及79.86%的 Kappa 系數(shù)。
3.建筑高度結(jié)果
通過(guò)可視化和高度分類(lèi)和 GABLE 數(shù)據(jù)集進(jìn)行了比較。GABLE 是一個(gè)通過(guò)光學(xué)影像識(shí)別中國(guó)所有建筑高度的產(chǎn)品,提供了 0-10、10-30、30-50、50-100、100-500 米高度區(qū)間的 RMSE 值。根據(jù)這些區(qū)間分類(lèi)數(shù)據(jù)后發(fā)現(xiàn),在50米以下的區(qū)間內(nèi),表現(xiàn)出更低的 RMSE 值。根據(jù)使用的 Baidu 數(shù)據(jù)統(tǒng)計(jì),98% 的建筑高度低于50米。另外,根據(jù)2020年中國(guó)人口普查,超過(guò)10層的住宅建筑(大致相當(dāng)于建筑高度超過(guò)30米)僅占1%。
圖13. 與GABLE建筑高度的可視化與比較
圖14. 分區(qū)模型和組合模型的相對(duì)誤差和絕對(duì)誤差值表示的不確定性
4. 建筑功能結(jié)果
劃分模型的表現(xiàn)優(yōu)于組合模型,住宅功能識(shí)別的精度更高,F(xiàn)1 分?jǐn)?shù)接近 0.90。而其他功能類(lèi)別,如辦公樓的識(shí)別精度略低,F(xiàn)1 分?jǐn)?shù)接近 0.80。相比之下,商業(yè)和公共服務(wù)功能的模型表現(xiàn)較差,F(xiàn)1 分?jǐn)?shù)約為 0.5。使用街景數(shù)據(jù)對(duì) 2500 棟建筑的功能進(jìn)行了人工驗(yàn)證,發(fā)現(xiàn) 88% 的建筑功能分類(lèi)是準(zhǔn)確的。這表明方法能夠正確識(shí)別大多數(shù)建筑的功能用途。
圖15. 建筑功能模型的準(zhǔn)確度
5.建筑質(zhì)量和年代結(jié)果
各種建筑質(zhì)量類(lèi)別的識(shí)別準(zhǔn)確率如下:“外立面損壞的建筑”(83.4%)、“非法/臨時(shí)建筑”(71.6%)、“涂鴉/非法廣告”(80.7%)、“門(mén)面差的商店”(89.8%)、“外立面不整潔的建筑”(79.9%)和“招牌差的商店”(84.6%)。建筑年代的準(zhǔn)確性則依賴(lài)于 GAIA 數(shù)據(jù)的精度。GAIA 各年份的平均總體準(zhǔn)確率高于 90%。利用安居客的住房交易數(shù)據(jù),其中包括 3771892 條房屋租賃,包含建筑年份和坐標(biāo)信息。發(fā)現(xiàn)在省級(jí)層面上,住房交易數(shù)據(jù)中的建筑年代與估計(jì)值之間存在顯著正相關(guān)關(guān)系。與 GAIA 的建筑年代數(shù)據(jù)相比,結(jié)果顯示平均差異為 8.7 年,GAIA 的建筑年代通常比住房交易記錄的時(shí)間要早。使用街景通過(guò)人工審核對(duì) 2500 棟建筑的質(zhì)量和年代進(jìn)行了手動(dòng)標(biāo)注,給建筑質(zhì)量問(wèn)題分配了從 0 到 6 的嚴(yán)重程度評(píng)分。與現(xiàn)有結(jié)果進(jìn)行相關(guān)性分析,得到了 R2 值為 0.78。關(guān)于建筑年代,將手動(dòng)標(biāo)注的建筑年代分為五個(gè)類(lèi)別(1985、1990、2000、2010和 2018),并統(tǒng)計(jì)所識(shí)別的建筑年代是否符合觀察到的真實(shí)類(lèi)別值,發(fā)現(xiàn) 82% 的建筑分類(lèi)驗(yàn)證是準(zhǔn)確的。
6.建筑結(jié)構(gòu)和風(fēng)格結(jié)果
目前,大型多模態(tài)模型(LMMs)如 GPT-4o 等已經(jīng)顯著改變了機(jī)器學(xué)習(xí)應(yīng)用建模的范式。測(cè)試并微調(diào)了CLIP 和 GPT-4o等模型。比較深度學(xué)習(xí)和大模型訓(xùn)練成本、精度差異和識(shí)別效率,發(fā)現(xiàn)LMMs 在推斷建筑結(jié)構(gòu)和風(fēng)格方面表現(xiàn)良好(見(jiàn)圖 S9)。
圖16. 通過(guò)街景微調(diào)LMMs預(yù)測(cè)建筑物屬性的準(zhǔn)確性
介紹
研究團(tuán)隊(duì)介紹
論文共同第一作者為清華大學(xué)城市規(guī)劃系博士生張業(yè)成、博士生趙慧敏,清華大學(xué)龍瀛教授為通訊作者。研究由國(guó)家自然科學(xué)基金重大項(xiàng)目(項(xiàng)目號(hào):62394335和62394331)、面上項(xiàng)目(城市收縮背景下城市空置的智能測(cè)度、機(jī)理認(rèn)知與規(guī)劃設(shè)計(jì)響應(yīng)研究,項(xiàng)目號(hào):52178044)和能源基金會(huì)項(xiàng)目(項(xiàng)目號(hào):G-2306-34815)資助。
同時(shí),龍瀛課題組已發(fā)布的相關(guān)數(shù)據(jù)集“全球1公里網(wǎng)格人口數(shù)據(jù)集(2020-2100)”,關(guān)聯(lián)論文入選ESI高被引論文,論文共同第一作者為清華大學(xué)城市規(guī)劃系博士生王新宇,清華大學(xué)出站博士后、中國(guó)礦業(yè)大學(xué)講師孟祥鳳,清華大學(xué)龍瀛教授為通訊作者。該數(shù)據(jù)集覆蓋全球248個(gè)國(guó)家或地區(qū),其空間分辨率為30弧秒(約1公里),間隔時(shí)間為5年。數(shù)據(jù)集同5個(gè)社會(huì)經(jīng)濟(jì)共享路徑情景(Shared Socioeconomic Pathways, SSPs)相統(tǒng)一。通過(guò)與WorldPop數(shù)據(jù)集在省級(jí)層面和網(wǎng)格層面的比較得到驗(yàn)證,可以作為各領(lǐng)域預(yù)測(cè)研究的輸入數(shù)據(jù)。成果于2022年9月在Scientific Data上以數(shù)據(jù)論文形式發(fā)布,目前數(shù)據(jù)瀏覽量超過(guò)14200次,下載量超過(guò)13400次。
文章URL:
建筑數(shù)據(jù):https://www.nature.com/articles/s41597-025-04730-5
人口數(shù)據(jù):https://www.nature.com/articles/s41597-022-01675-x
數(shù)據(jù)和代碼:
建筑數(shù)據(jù):https://doi.org/10.6084/m9.figshare.27992417
人口數(shù)據(jù):https://doi.org/10.6084/m9.figshare.19608594
聲明:本文系轉(zhuǎn)載自互聯(lián)網(wǎng),請(qǐng)讀者僅作參考,并自行核實(shí)相關(guān)內(nèi)容。若對(duì)該稿件內(nèi)容有任何疑問(wèn)或質(zhì)疑,請(qǐng)立即與鐵甲網(wǎng)聯(lián)系,本網(wǎng)將迅速給您回應(yīng)并做處理,再次感謝您的閱讀與關(guān)注。