[ Day 14 ] Flutter 語音辨識實戰應用篇— 生活在地球的勇者啊，你聽過阿彌陀佛嗎(5) #地端語音轉文字

2025 iThome 鐵人賽

DAY 14

Mobile Development

17th鐵人賽

170 瀏覽

2025 iThome鐵人賽
「 Flutter ：30天打造念佛App，跨平台從Mobile到VR，讓極樂世界在眼前實現 ! 」
Day 14
「 Flutter 語音辨識實戰應用篇 — 生活在地球的勇者啊，你聽過阿彌陀佛嗎(5) 」

前言

前兩天我們已經認識雲端語音轉文字以及實作Google Cloud Speech to Text ，
今天我們就來一起初步認識「地端語音轉文字」！

Day 14 文章目錄：
一、地端語音轉文字
二、地端vs.雲端
三、套件參考

1. 簡介

地端語音轉文字指的是不將錄音上傳到外部雲端，
而是在使用者裝置或自家伺服器（內網）完成語音辨識。

備註：
中文常見用詞「地端 / 本地部署」，英文多用「On-Device / On-Premise / Edge」

2. 常見落地型態

(1) 裝置（On-Device / Edge）

直接在手機、平板或邊緣設備上完成語音辨識

優點：離線可用、延遲極低、資料不離機
適合：即時字幕、離線環境、即時語音指令

備註:
裝置端通常具備離線能力，但是否「完全離線」取決於是否仍依賴外部網路（如授權、模型下載、雲端後處理或同步）。

(2) 內網（On-Premise / Self-Hosted）

將 STT 引擎部署在企業自有的伺服器或私有雲

優點：資料不出內網、可彈性擴充
適合：金融、醫療、政府、法遵要求高的場景。

3. 常見應用情境

(1) 智慧筆記：會議逐字稿、課堂講解
(2) 敏感場域：醫病對談、客服錄音
(3) 弱網／無網：偏鄉、大型展館會場

套件名稱	收費	支援平台	離線能力	整合方式	常見用途	授權（License）	Likes / Pub Points / Downloads（pub.dev，2025-09-28）
whisper_ggml (1.7.0)	開源	Android / iOS / Linux / macOS / Windows	支援離線 ASR	FFI（綁原生推論庫）	多語字幕、逐字稿	MIT	16 / 160 / 630
vosk_flutter_2 (1.0.5)	開源	Android	支援離線 ASR	FFI（原生 SDK 綁定）	低資源裝置、固定詞彙離線轉錄	Apache-2.0	6 / 150 / 345
sherpa_onnx (1.12.14)	開源	Android / iOS / Linux / macOS / Windows	支援離線 ASR	FFI（多平台原生封裝）	本機多功能 ASR（含VAD／標點／說話者分離）	Apache-2.0	70 / 140 / 4.24k