前一天我們介紹了如果說沒有機器學習該怎麼解決問題,今天來介紹Cloud Vision API和Video intelligence API
Cloud Vision API是一個圖片檢測的API,只要給他一張圖片,他就會告訴你說在這張圖片當中有哪些物件,Vision API的核心是標籤檢測功能,會提取出圖片中的文本或圖像,然後告訴你文本的位置以及語言,也可以檢測出Logo以及地標的經緯度,而且還有辨識臉部表情,識別照片中人像的心情如何,這都讓我滿驚訝的,沒想到功能如此強大。
講者也有在影片中測試Cloud Vision API的使用過程和測試一些圖片:
Cloud Vision API當中還有個功能是安全搜索,餵進去圖片後會告訴你圖片是否是合適的,並且把它分類成不同的類別,確保一些不適當的內容像是色情血腥暴力之類的內容出現。
在API當中可以查看他的JSON,記錄物件的名稱和他的座標位置:
Video intelligence API跟剛剛的Cloud Vision API很像,都是進行標籤檢測,只是他使用在影片當中,Video intelligence API會針對影片的兩種層次做描述,比較高的層面會告訴你這部影片主要是什麼?比較細微的層面會就影片當中每一場景發生什麼進行描述,Video intelligence API也會針對場景所在位置做標記、JSON格式記載相關資訊、也有識別不當內容的機制,這些功能大部分和Cloud Vision API的是一樣的。
今天先介紹到這,明天我們來介紹Cloud Speech API和Translation and NL