iT邦幫忙

2024 iThome 鐵人賽

DAY 3
0

概述

專案緣起: 用說的UI

專案緣起

這個專案的靈感來自一個簡單的 AWS Lambda Function。當時主要是想在當免費仔的前提下,練習Spring Boot 和 Serverless技術,順便串通當年還很新奇的LINE Bot,最終用一個簡單的Rich menu做出一個簡單的重量訓練課表紀錄器。畢竟,這些服務在正常使用的情況下都不用錢。

一般UI操作: 點擊Combo

當我好不容易把Spring Boot程式擺到Lambda上後,下一步就是要有使用者介面紀錄課表。於是我開始參考現在一些App是怎麼做的。以做了 ”低背槓式深蹲” 為例,操作大致如下:

  • 1.選擇動作:
    先選擇深蹲,需要點選下拉式選單或者搜尋列表: 2次點擊
    是用直槓做而不是啞鈴,所以要選到正確的器材: 2次點擊
    因為槓位不同,還要選擇”低背槓”: 2次點擊
  • 2.紀錄訓練容量
    這邊要紀錄的內容有點多,包含了重量、次數、休息時間,和感受度等,大概需要8~10次點擊
    如果做了4組深蹲,每組的感受度不同,例如前3組感覺還好,大概是6,最後一組因為力竭已經快往生了,大概是10。
    https://ithelp.ithome.com.tw/upload/images/20240917/201052279TNXeMhPvY.jpg
    https://ithelp.ithome.com.tw/upload/images/20240917/201052279p5KkiR6Gk.jpg
    圖片: 市面上某課表App

使用這些市面上的 App 後,發現幾個顯而易見的缺點:

點擊數太多和眼睛疲勞

有重訓經驗的人都知道,一張課表會包含很多動作。而上述操作就耗費了在手機上超過10次點擊 + 尋找目標所需的眼力。紀錄了什麼呢? 只有“一組” 動作的訓練量,要完成一張課表的紀錄操作,可能比真正的訓練還累,尤其是你的眼睛和大拇指。

用說的使用者介面 (User Interface)

隨著 OpenAI 的興起,我自己體驗過 ChatGPT 的強大意圖分類(Intent classification)和總結能力(Summarize),腦海中就有個想法:如果我們能「用說的」來完成這些繁瑣的操作,會不會更輕鬆?

其實現在的手機軟硬體技術已經讓語音辨識變得十分準確,加上 LINE 的整合,「用說的」來表達文字變得更加輕而易舉。而我覺得OpenAI對自然語言的處理能力,則像是完成了這種「用說的 UI」 最後一哩路。

OpenAI 的官方文件提到,使用 text generation models ,可以讓軟體具備自然語言界面」 (“Give software a natural language interface”),這對於像是安排課表這種重複性高,但又需要微調細節的操作可能蠻適合的。

因此就開始著調整系統架構。下一篇將描述我在調整過程中遇到的挑戰與思考的方向。

Citation

https://platform.openai.com/docs/guides/text-generation/text-generation-models


上一篇
架構描述: 系統組成
下一篇
架構描述: 技術考量
系列文
從零開始構建能理解語義的 Linebot 架構12
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言