圖片來源:https://zhuanlan.zhihu.com/p/161828142
昨天我們看了Deepface的模型特色--對齊機制 和網路結構,我們知道相比其他人臉辨識API,Deepface的特色就是對齊機制,今天我們就來聊聊建立對齊機制的工具們。
今天的實作是針對網路結構的優化過程,詳情可見colab檔。
現今有多個公開的 3D 臉部模型可用於正面化處理,這些模型各具特色並適用於不同應用場景,為面部重建和對齊提供了豐富的選擇 。
FLAME(Faces Learned with an Articulated Model and Expressions)是目前最受歡迎的 3D 臉部模型之一,該模型基於超過 33,000 個精確對齊的 3D 掃描數據訓練,包含來自 3,800 個受試者的頭部掃描數據 。
FLAME 的核心特點包括 :
Basel Face Model 是經典的 3D 可變形面部模型,包括 BFM09 和更新的版本 。該模型基於 200 名受試者(100 名女性和 100 名男性)的 3D 面部掃描構建 。BFM 廣泛應用於面部重建研究,並提供了與 FLAME 模型的轉換工具 。
現代 3DMM 系統提供了多種專門化的模型 :
HIFI3D+++ 是一個高品質的 3DMM 基礎模型,通過對齊和重新拓撲化多個 3D 面部資料集構建 。該模型在 REALY 基準測試中展現出優異性能,提供了更精確的面部重建能力 。
MICA(Metrical Face Reconstruction)框架提供了統一現有 3D 面部資料集的方法,將不同資料集轉換為通用 FLAME 拓撲結構 。這種統一方法使得研究者能夠利用更大規模的訓練數據。
FLAME 生態系統提供了豐富的資料集選擇 :
現代資料集還包括多模態信息 :
多個開源項目支持這些模型的使用 :
現代應用框架提供了完整的正面化處理管道 :
對於學術研究,FLAME 模型提供最全面的功能和最大的社群支持,特別適合需要表情控制和頭部姿態調整的應用 。Basel Face Model 則更適合基礎的面部重建任務 。
商業應用可考慮使用經過優化的模型變體,如針對特定人群或應用場景優化的專門模型 。
對於實時處理需求,輕量級的 FLAME 變體或經過優化的 3DMM 實現更為適合 。
所有這些模型都可以通過適當的許可協議免費用於研究目的,為面部正面化和重建提供了強大的技術基礎。
資料來源1:https://flame.is.tue.mpg.de
資料來源2:https://dl.acm.org/doi/fullHtml/10.1145/3395208
資料來源3:https://github.com/TimoBolkart/FLAME-Universe
資料來源4:https://openaccess.thecvf.com/content/CVPR2023/papers/Han_Learning_a_3D_Morphable_Face_Reflectance_Model_From_Low-Cost_Data_CVPR_2023_paper.pdf
資料來源5:https://github.com/TimoBolkart/BFM_to_FLAME
資料來源6:https://pmc.ncbi.nlm.nih.gov/articles/PMC9687570/
資料來源7:https://www.ecva.net/papers/eccv_2022/papers_ECCV/papers/136680072.pdf
資料來源8:https://arxiv.org/html/2308.07551
(本文章由perplexity和筆者協作而成)
由筆者從Kaggle FANE: Facial Expressions & Emotion Dataset 抓取圖片,再到roboflow做標記後生成。總比數有1149筆,開心的有553筆,憤怒的有596筆。
正確預測平均信心度: 0.8951
正確預測置信度標準差: 0.1037
錯誤預測平均置信度: 0.7109
錯誤預測置信度標準差: 0.1402