[Day21] GCP當中好用的API：Cloud Vision API與Video intelligence API

第 11 屆 iThome 鐵人賽

DAY 21

Google Developers Machine Learning

透視Google Machine Learning的奧秘系列第 21 篇

11th鐵人賽 #gcp #machine learning

芋頭

2019-10-06 10:15:41

2292 瀏覽

分享至

前一天我們介紹了如果說沒有機器學習該怎麼解決問題，今天來介紹Cloud Vision API和Video intelligence API

Cloud Vision API

Cloud Vision API是一個圖片檢測的API，只要給他一張圖片，他就會告訴你說在這張圖片當中有哪些物件，Vision API的核心是標籤檢測功能，會提取出圖片中的文本或圖像，然後告訴你文本的位置以及語言，也可以檢測出Logo以及地標的經緯度，而且還有辨識臉部表情，識別照片中人像的心情如何，這都讓我滿驚訝的，沒想到功能如此強大。

講者也有在影片中測試Cloud Vision API的使用過程和測試一些圖片：

範例圖片
人像表情

Cloud Vision API當中還有個功能是安全搜索，餵進去圖片後會告訴你圖片是否是合適的，並且把它分類成不同的類別，確保一些不適當的內容像是色情血腥暴力之類的內容出現。

在API當中可以查看他的JSON，記錄物件的名稱和他的座標位置：

JSON

Video intelligence API

Video intelligence API跟剛剛的Cloud Vision API很像，都是進行標籤檢測，只是他使用在影片當中，Video intelligence API會針對影片的兩種層次做描述，比較高的層面會告訴你這部影片主要是什麼？比較細微的層面會就影片當中每一場景發生什麼進行描述，Video intelligence API也會針對場景所在位置做標記、JSON格式記載相關資訊、也有識別不當內容的機制，這些功能大部分和Cloud Vision API的是一樣的。

Video intelligence API