物體識別指的是讓計算機(computer)去分析一張圖片或者一段視頻流中的物體,並標記出來,這需要給神經網絡大量的物體數據去訓練它才能進行識別。
Ex:在圖片中偵測出腳踏車和狗狗,並標記出來。
風格轉移是指一類操縱數字、圖像或視頻的軟件算法,以採用另一種圖像的外觀或視覺風格,例如將名畫的外觀轉移到用戶提供的照片上。
Ex:將梵谷的畫風轉移至照片上。(包括色調、線條粗細等。)
圖像分割指的是將圖像細分為多個圖像子區域的過程。圖像分割的目的是簡化或改變圖像的表示形式,使得圖像更容易理解和分析。圖像分割通常用於定位圖像中的物體和邊界(線、曲線等)。
Ex:分析車子周圍的各種物件,並保持安全距離(運用於自動駕駛等。)
利用某種幾何模型或結構來表示物體的結構和形狀,並通過提取某些物體特徵,在模型和圖像之間建立起對應關係,然後通過幾何或者其它方法實現物體空間姿態的估計。這裡所使用的模型既可能是簡單的幾何形體,如平面、圓柱,也可能是某種幾何結構。來源
視頻跟踪是使用相機隨時間定位移動物體的過程。它有多種用途,其中包括:人機交互,安全和監控,視頻通信和壓縮,增強現實,交通控制,醫學成像和視頻編輯。
根據描述生成逼真的圖像非常困難,並且需要多年的圖形設計培訓。 在機器學習中,這是一個生成任務,比判別任務更具挑戰性。參考
如果想要做自動駕駛,那你就需要 image segmentation 來幫助你判斷圖片中 哪裡是路 哪裡是路人 哪裡是前車。
如果你想要做美圖修修的app 那你就需要style transfer 來幫你用圖片做濾鏡,所以其實常常input是圖片的狀況很多。
以上前面提到的DNN(Deep Neural Network, 深度學習)無法滿足, 你應該會想問 為甚麼不能用DNN呢?DNN不是很厲害什麼都可以解決嗎?