前幾篇提到很多人工智慧介紹及它可能含有的1%問題,現在就要來講它的三大應用分別是:語音辨識、影像辨識和自然語言處理。
語音辨識
這項功能主要是讓機器能辨識使用者的請求,並且能給出回應。人類生長過程,出生前一年主要聽力為主,而後年則可開始做些簡單的回應,所以其實人類在很年幼時就能理解父母或者是大人想跟他說的話,但電腦在有機器學習,人工智慧後並沒有馬上能有這種功能,是在近幾年才能夠聆聽和回應使用者。其實這項困難點在於使用者的口音有非常多種,因此如果要用傳統的數學或者是電腦科學,更或者是倚靠機器學習來完成是非常困難的,但近年使用深度學習,便可讓這項功能慢慢成形。
自然語言理解
自然語言其實是希望能讓系統了解使用者所有的語言、語調等。這一開始對於演算法來說是非常困難的,因為也許同樣的文字帶有不同的情緒就有不同的意思。這項功能需要三種分析來完成,語素分析、語意分析及語意分析,語素分析會先分解出最小的字義單位,緊接著再進行語法分析,畢竟每種語言的語法其實是不同的,最後在透過語意分析來了解話語中的含意。
影像辨識
影像辨識其實是這三大應用中最容易的,提供百萬個加上標註的圖片後,演算法就能協助辨識主體,而透過深度學習更能讓此功能更深入,透過神經網路,一般的圖片辨識已經有和人類同等的辨識率甚至精準,但在動態影像這方面,目前依然無法和人類比擬。如果目前運用到影像辨識作熱門的領域,那非自動駕駛莫屬了。
介紹完三大應用,接下來幾天要介紹人工智慧在各領域各產品上的應用。
參考文章:https://meethub.bnext.com.tw/%E5%AE%8C%E6%95%B4%E8%A7%A3%E6%9E%90ai%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7%EF%BC%9A3%E5%A4%A7%E6%B5%AA%E6%BD%AE%EF%BC%8B3%E5%A4%A7%E6%8A%80%E8%A1%93%EF%BC%8B3%E5%A4%A7%E6%87%89%E7%94%A8%EF%BD%9C/