2024 iThome 鐵人賽

DAY 3

0

Software Development

從零開始構建能理解語義的 Linebot 架構系列第 3 篇

架構描述: 專案緣起

16th鐵人賽

2024-09-17 23:08:15

157 瀏覽

分享至

概述

專案緣起: 用說的UI

專案緣起

這個專案的靈感來自一個簡單的 AWS Lambda Function。當時主要是想在當免費仔的前提下，練習Spring Boot 和 Serverless技術，順便串通當年還很新奇的LINE Bot，最終用一個簡單的Rich menu做出一個簡單的重量訓練課表紀錄器。畢竟，這些服務在正常使用的情況下都不用錢。

一般UI操作: 點擊Combo

當我好不容易把Spring Boot程式擺到Lambda上後，下一步就是要有使用者介面紀錄課表。於是我開始參考現在一些App是怎麼做的。以做了 ”低背槓式深蹲” 為例，操作大致如下:

1.選擇動作:
先選擇深蹲，需要點選下拉式選單或者搜尋列表: 2次點擊
是用直槓做而不是啞鈴，所以要選到正確的器材: 2次點擊
因為槓位不同，還要選擇”低背槓”: 2次點擊
2.紀錄訓練容量
這邊要紀錄的內容有點多，包含了重量、次數、休息時間，和感受度等，大概需要8~10次點擊
如果做了4組深蹲，每組的感受度不同，例如前3組感覺還好，大概是6，最後一組因為力竭已經快往生了，大概是10。

圖片: 市面上某課表App

使用這些市面上的 App 後，發現幾個顯而易見的缺點:

點擊數太多和眼睛疲勞

有重訓經驗的人都知道，一張課表會包含很多動作。而上述操作就耗費了在手機上超過10次點擊 + 尋找目標所需的眼力。紀錄了什麼呢? 只有“一組” 動作的訓練量，要完成一張課表的紀錄操作，可能比真正的訓練還累，尤其是你的眼睛和大拇指。

用說的使用者介面 (User Interface)

隨著 OpenAI 的興起，我自己體驗過 ChatGPT 的強大意圖分類(Intent classification)和總結能力(Summarize)，腦海中就有個想法：如果我們能「用說的」來完成這些繁瑣的操作，會不會更輕鬆？

其實現在的手機軟硬體技術已經讓語音辨識變得十分準確，加上 LINE 的整合，「用說的」來表達文字變得更加輕而易舉。而我覺得OpenAI對自然語言的處理能力，則像是完成了這種「用說的 UI」最後一哩路。

OpenAI 的官方文件提到，使用 text generation models ，可以讓軟體具備自然語言界面」 (“Give software a natural language interface”)，這對於像是安排課表這種重複性高，但又需要微調細節的操作可能蠻適合的。

因此就開始著調整系統架構。下一篇將描述我在調整過程中遇到的挑戰與思考的方向。

Citation

https://platform.openai.com/docs/guides/text-generation/text-generation-models

架構描述: 系統組成

架構描述: 技術考量

系列文

從零開始構建能理解語義的 Linebot 架構共 30 篇

目錄

RSS系列文訂閱系列文

5 人訂閱

完整目錄

直播研討會

{{ item.subject }}

{{ item.channelVendor }} {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22195 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙