iT邦幫忙

2024 iThome 鐵人賽

DAY 24
0
生成式 AI

用AI寫程式也是要點本事的系列 第 24

最後一週,準備開始衝刺....

  • 分享至 

  • xImage
  •  

短短一個月內,與Github copilot同質的AI工具接二連番冒出頭,然後Github copilot自己似乎也悄悄的將copilot做了些調整,回覆問題的風格明顯不同。

計畫設計的功能:讓使用者可以隨意輸入文字後轉由Google的「text to speech」產生一段語音,並轉檔後可以隨意將檔案使用在別的地方。文字要能分段輸入,方便使用者編輯,還要能控制段落之間的休息空白間隔,方便未來插入影像檔內。(如果無法轉檔,可能要考慮改成「編輯文本」,將使用者將文本儲存在雲端後,可以將文本傳遞給其他人,或他人可以在特別設計過的播放工具內取得文本後在播放語音。)整個工具都在網頁環境執行,可以省去使用者安裝APP的步驟,因此介面要乾淨、減少視覺性素材的使用。

具體需要完成的工作項目(會標注執行情況):
1.可以輸入多段文字的介面。(完成)
2.將多段文字逐一播放。(完成)
3.轉成檔案。(失敗)
4.網頁環境錄音。(完成)
5.使用IO功能將錄音轉成檔案。(失敗)
6.可以插入控制語音段落間隔的介面。(尚未開始)
7.判斷間隔長度,控制文字語音段落間的空白長度。(尚未開始)
8.使用轉檔編譯演算法將錄音轉成檔案。(障礙排除中)
9.使用第三方元件或功能將錄音轉成檔案。(障礙排除中)

如果這是個專案,三個禮拜(每日兩小時的工作時間)過去後,執行率只有45%左右。

雖然這是個混雜了「需求設計」的專案,本來就不該只安排一個月(每日兩小時)的工作時程,但專案規格內容無法落實(被標註為「失敗」)而必須進行檢討與修改的比例頗高。
就此來看,外行人要全靠AI就來設計自己想要的程式,似乎還有很長的一段路要走。

但需要努力的並不只是AI的功能而已。
軟體設計的「概念」能否科普化、模組化,也是左右這件事情未來發展潛能的關鍵因素。


上一篇
原來錄音功能可以指定「產生的資料類型」
下一篇
再嘗試一個套件 : flutter_ffmpeg
系列文
用AI寫程式也是要點本事的30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言