ASR(Automatic Speech Recognition)為語音辨識模型,語言可以選擇,不管是輸入及輸出都可以選擇語言,所涵蓋的語言代號請參考連結:Se...
早安嗨囉!
今天來聊聊語音辨識的語音訊號,語音到底是怎麼在人體身上產生的,當我們了解人類的發音,就可以為編寫模組找到更好的方向喔!
語音產生的機制
人類發聲會...
在這異世界,「詠唱」是一種強大的技能,而我首次接觸的詠唱就是ChatGPT。這款AI聊天機器人在這裡被視為一種魔法工具,但要完全掌握它並不容易。以下是一些建議,...
今天把下載到的pretrain資料重新整理了一遍,並且加入了百度的資料,百度的檔案很大,我的電腦只有64GB的記憶體,使用原本的data_process.py中...
在導入 dbt 之前的世界
2022 年,當時的公司主要透過:
Google BigQuery 儲存 SQL-based 的 stored-procedure...
YOLOv3: An Incremental Improvement
Joseph Redmon, Ali Farhadi
模型比YOLOv2還要大因此更準,但...