今天要介紹模糊控制,你可能會想:欸?不是已經介紹完強化學習了嗎怎麼又蹦出一個模糊控制。其實模糊控制是我之前做實驗有使用過的一項技術,而且我也覺得蠻有趣的,所以想拿出來聊聊。
假設今天我們走在炎熱的墾丁,我們會說「阿好熱啊!」,此時不管氣溫是35度還是40度,我們都會直呼好熱。這代表了有時候模糊的敘述可以比較符合我們人類社會的客觀敘述。
模糊邏輯這個概念是美國學者Lotfi A. Zadeh於1965年所提及,在1973年將此概念應用在控制領域,雖然要嚴格地以數學等方式證明模糊邏輯的成果有點困難,不過許多研究都指出模糊邏輯效果較好。不過似乎並不是一定會有好的效果,所以我將這個概念留置最後,各位可以看看使用模糊控制與否對強化學習的訓練效率如何。
基本上要模糊化變數有很多方式,不過我們這邊會使用一個叫隸屬函數(membership function, mf)來模糊化變數,隸屬函數有許多種,也可以根據各位的想法去調整具體內容是甚麼。以及輸出的格式等。具體明天介紹給各位。
模糊控制簡單介紹到這邊,明天會帶大家看看常見的隸屬函數,並且在python中實現。他的數學方程式不會到太複雜,若完全不懂的話可以直接跳過或者去找找看相關資源及教學。