說到電腦視覺辨識的應用,大家往往聯想到的是車牌辨識、醫療影像、工地安全警示等應用,但應用在建築設計圖紙領域相對較少,且目前多數在研究起步階段,因此本文會先從產業現況出發,剖析傳統建築圖處理的痛點,並進一步探索各種AI技術在建築圖領域應用的可行性,期望帶給讀者不一樣的視野與啟發。
前一篇提到建築資訊模型(BIM)在台灣仍較難普及化的原因,這現象或許與長期建築圖繪製的教育訓練方式有關。從早期的手繪圖到1990年代開始普及的電腦繪圖,再到如今蓬勃發展的參數化設計與建築資訊模型,長達近35年的時間,都仍是以2D繪圖為核心,才進一步由人工識圖辨別平面、立面、剖面圖等資訊後,再憑經驗、專業、想像轉化及建置成為3D資訊模型。然而,這種高度仰賴人工識圖與專業分工的流程,使得BIM技術雖然發展迅速,卻很難在現有產業體系中大規模普及。
近年來,電腦視覺辨識技術在各領域已有顯著應用,然而建築圖既然在2D轉3D的工作流程中有技術門檻,那何不嘗試透過AI物件自動辨識輔助人工建模呢?如果AI能協助自動辨識圖紙上的物件,是否就能大幅降低人工建置的負擔,進一步促進自動化建模的實現?我想這應該是一個滿具有趨勢與潛力的方向。
因此,以下我整理簡介了YOLO(物件偵測)、OCR(文字辨識)、以及BIM/IFC相關數位標準,讓讀者們能夠先快速地了解可應用的方向:
YOLO是一種近年來廣泛應用於電腦視覺領域的即時物件偵測演算法。它主要透過多層卷積的深度神經網路,最終能快速在影像或圖像上預測出物件的位置及信心分數,當物件邊界框分數越趨近於1時,代表預測的越準確,但本質上仍是機率預測,仍可能出現誤判的情形。不過近年來已有眾多優秀版本的開源模型,更多的還是取決於資料集標註的品質與參數調整。
OCR是能將圖片中的文字自動轉換為可編輯文字檔的一種數位技術,它廣泛應用於文件數位化、圖像/證件掃描等方面。而在建築圖的應用上,可作為在複雜交錯圖元當中,讀取標註尺寸或文字、空間名稱等資訊的讀取。
BIM與傳統的3D模型不同,其顧名思義即模型內帶有各類工程資料(如尺寸、材質、量體數據、設備資訊等),當BIM模型被修改時,2D圖面和工程數據也能自動同步更新,達到改一處、其餘自動同步更新的狀態,能有效減少設計的遺漏,而這也是近年來極力推動建築產業數位化的重要基石。
在建築產業中,因為設計、結構、機電、管線設備等不同專業分工,各自習慣使用不同品牌的繪圖軟體,導致各自專有軟體的資料格式無法互通,經常出現「重複建模」、「資訊遺失」的情況。
為了解決這類跨平台溝通與協作的難題,IFC這套開放式資料交換標準應運而生。IFC格式本質上是一種以純文字數據串來描述建築元件、性質與關聯的國際通用格式,它能讓不同BIM軟體之間直接讀取成為3D模型,因此,我們若藉著AI技術分析所獲得的數據,嘗試轉化為IFC數據格式,便有大幅提升建模自動化的可能性。
今天探索學習了可應用於建築圖的技術與標準,接下來,我將在後面的章節中,嘗試以實際案例來驗證AI輔助建築圖資訊轉換的潛力與挑戰。