米娜桑~在看完主題小劇場後,都可以理解老闆的需求了吧!
兩週提交一個 簡單、陽春版的語音聊天機器人
,Demo 給老闆看
可以想像成鋼鐵人的 Jarvis 網頁版
接著就讓我們邊勾勒產品的模樣,邊進行分析
這個語音聊天機器人,到底會需要用到哪些技術吧!
1. 網頁要能夠接收使用者的聲音
getUserMedia()
,可以取得使用者麥克風輸入的即時音訊,再利用 Web Audio API搭配MediaStream Recording API 的 MediaRecorder
,可以將音訊轉錄成檔案,用以傳送至後端。2. 使用者講的話,機器人要能夠理解分析 (後續簡稱 chatGPT 吧,不演惹 AI)
Speech-to-Text API
(簡稱 STT),將音訊檔轉成字串餵給 AI。3. AI 分析完,要能用語音回覆
Text-to-Speech API
(簡稱 TTS),將字串轉成音訊檔,並透過 Web APIs 中的 Audio 來播放。