DAY30 語音辨識實作—ChatGPT教我做

2023 iThome 鐵人賽

DAY 30

AI & Data

AI與語音辨識系列第 30 篇

15th鐵人賽

meooooow

2023-10-15 01:33:14

3354 瀏覽

分享至

嗨囉安安，今天是最後一天，也是一個簡單的小實作。

這次請到了ChatGPT麻麻來手把手教我們如何簡單運用現有套件來執行語音辨識（要我自己從頭開始做大概要一年）。
請大家準備好你們的Anaconda或直接開啟你的Jupyter Notebook！

這次會我們使用到Python的Speech Recognition資料庫。

在終端機執行這段程式碼來下載。（也可以在Jupyter Notebook執行）

再來還要下載可以套用麥克風的相關庫：（這邊我一開始沒裝，有其他音訊處理的庫也可以用已經有的）

可以在終端機或者Jupyter Notebook執行。

再來就是貼上程式碼並執行。

詳細的程式碼如下：

import speech_recognition as sr 
import csv 

def Voice_To_Text(duration=7):  
    r = sr.Recognizer() 
    with sr.Microphone() as source: 
        print("請開始說話:") 
        r.adjust_for_ambient_noise(source) 
        audio = r.listen(source, phrase_time_limit=duration) 
    try: 
        Text = r.recognize_google(audio, language="zh-TW") 
    except sr.UnknownValueError: 
        Text = "無法翻譯" 
    except sr.RequestError as e: 
        Text = "無法翻譯{0}".format(e) 
    return Text 
csv_path = "output.csv" 
header = ["Text"] 
with open(csv_path, "w", newline="", encoding="utf-8") as csv_file: 
    csv_writer = csv.writer(csv_file) 
    csv_writer.writerow(header) 
    for i in range(3): 
        Text = Voice_To_Text(10) 
        csv_writer.writerow([Text]) 
        print(Text) 
print("已將語音轉換結果寫入 output.csv 文件")

結果如下：