這是周末所進行的實驗性專案,嘗試在Arduino UNO Q開發板(4GB版本)上運行大語言模型。當然本身Arduino UNO Q的微處理器是跑不動大模型的(但即將推出的Arduino Ventuno Q開發板就可做到),因此需要「外掛」NPU(Neural Processing Unit,神經處理單元)來做到這件事情。在這邊使用的NPU裝置是ASUS UGen300 USB AI 加速器,相關介紹可以參考我之前的開箱文與大神的心得分享。
在開始之前請先準備相關環境。Arduino UNO Q開發板需運作在「SBC 開發模式」上,因此需要額外的周邊:
進一步內容請參考官網文章說明,以下是環境的實拍畫面:

環境準備好後接下來都會在Arduino UNO Q開發板上運作。以下分別說明各項步驟:
hailortcli fw-control identify
這邊展示的是VLM的用法,而LLM(大語言模型,單純只有文字對話)也是相同的方式。