iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 17
0
自我挑戰組

數位賦能,PM自我升級的起手式系列 第 17

Day 17 - 物聯網資料運用競賽 (Part 3) - 解決方法

  • 分享至 

  • xImage
  •  

https://ithelp.ithome.com.tw/upload/images/20190928/20112421EcG64fZCGF.png

  1. 語音對話的功能,本團隊採用Google Assistant的Action on Google語音平台來建置所需的語音問答介面,取名為「空氣汙染履歷」,支援"繁體中文"的語音功能,亦同時支援Android和iOS手機介面的圖像顯示,語音與文字皆可輸入,資料存取皆由雲端做即時服務與更新,在對話過程中可以記錄下所詢問的"特定地點"、"詢問時間"...等等相關的語音資訊做進一步的數據分析,主要目的是對長期目標的新增觀測站的選址與群眾募資時之參考依據。

https://ithelp.ithome.com.tw/upload/images/20190928/20112421tqtBt4YVeF.png

  1. 透過語音查詢所獲得的地點資訊,本團隊採用Google Map Platform中的(Geocoding API 與Map JavaScript API)做搭配使用,將地點或地址轉換為經緯度的地理座標,再回傳給本團隊自行開發的空汙演算法API做查詢,再由Google Assistant的手機介面上做語音回答與PM2.5濃度之圖文顯示,也提醒使用者注意目前PM2.5濃度下的人體影響與活動建議,至於連續路徑上採用"開放地理資訊編碼標準"的KML格式,只要將Google Map上的路線用KML檔案匯出,再匯入空汙演算法的API,即可得知多點的PM2.5估算結果,再利用可視化工具做路徑上之濃度曲線的呈現。

https://ithelp.ithome.com.tw/upload/images/20190928/20112421vytTp0FlUL.png

  1. 技術核心的空汙演算法以從使用者得到輸入的經緯度與時間,輸出在該地點與時間預測的PM2.5,預測模型會從眾多機器學習與深度學習的迴歸模型裡挑選。雖然挑選適合的模型很重要,但特徵工程的好壞對模型的預測精準度會有決定性的影響,因此本團隊在訓練模型之前會著重在特徵工程上,例如對輸入地點,使用距離最近的K個觀測站的資料為特徵;而最近的K個觀測站,並不會有剛好在輸入時間點的資料,此時有兩種做法:一為將該站最近的一筆量測資料與輸入時間點的時間差作為特徵之一,另一為用該站的歷史資料預測輸入時間點的PM2.5(如外推法、移動平均線…等等);到最近的K個觀測站的距離,可使用距離的反比或距離的平方的反比;對輸入時間,可以取得季節、月份、週、星期、週間或週末、小時為特徵。以每個觀測站本身的地點與其一筆歷史資料的時間點與PM2.5當作Ground Truth,加上選擇的特徵,來做為一筆訓練資料,也就是說觀測站的所有歷史資料都可以變成訓練資料。訓練資料會再進一步分成training、validation、testing sets以做模型挑選與測試。

https://ithelp.ithome.com.tw/upload/images/20190928/201124219UuuOKvrU8.png


上一篇
Day 16 - 物聯網資料運用競賽 (Part 2) - 目標問題
下一篇
Day 18 - 物聯網資料運用競賽 (Part 4) - 創意構想
系列文
數位賦能,PM自我升級的起手式30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言