iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
自我挑戰組

菜鳥AI工程師給碩班學弟妹的挑戰 系列

剛當AI工程師兩年,希望將自己兩年來所學記錄下來,並且能幫助到剛升到研究所的學弟妹。
本挑戰預計帶給大家:
1. 以pytorch lightning 框架寫出一個屬於自己的model
2. 資料缺乏,如何利用爬蟲收集音檔文字...
3. fastapi + docker deploy

鐵人鍊成 | 共 30 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文
DAY 1

環境架設

想當初剛進實驗室的時候,第一件遇到的事就是怎麼使用記中的server,通常大家共同使用的server都會灌一個名為docker的小鯨魚,目的就是為了讓大家各自建...

2024-08-05 ‧ 由 jeremylee 分享
DAY 2

[Day2] 環境架設 - 2

前情提要: 昨天透過docker run 的方式起了一個包含pytorch及cuda的container環境,當中透過-v來做連結的概念,通常我習慣連結到con...

2024-08-06 ‧ 由 jeremylee 分享
DAY 3

[Day3] 爬蟲收集音檔 - 1

在container內部,有時候需要跑多個程式,但每個程式環境不一樣的話,有以下幾種方法,那我自己如果只是測試某個程式,我會用venv的方式來做,就可以用上一篇...

2024-08-07 ‧ 由 jeremylee 分享
DAY 4

[Day4] 爬蟲收集音檔 - 2

前情提要: 昨天透過了 web 的開發者模式找到 mp3 的實際音檔,但整個過程都是手動操作,有什麼辦法才能爬取到全部的音檔呢? 一開始我的想法是 主頁(ht...

2024-08-08 ‧ 由 jeremylee 分享
DAY 5

[Day5] 爬蟲收集音檔(+ yt-dlp) - 3

前情提要: 昨天已經把所有的DJ名稱和url儲存到mp3_urls.txt,今天我們將透過多個thread來並行下載,增加下載的速度。 1. 下載mp3 這裡...

2024-08-09 ‧ 由 jeremylee 分享
DAY 6

[Day6] 細講pytorch Dataset - 1

今天我們終於要來細談pytorch當中的Dataset,因為本人是在語音AI公司上班,所以對於影像方面並沒有研究,以下例子主要為文字與聲音。 強烈建議跟著一行行...

2024-08-10 ‧ 由 jeremylee 分享
DAY 7

[Day7] 細講pytorch Dataset - 2

前情提要: 昨天我們已經透過get_item將txt裡面的路徑跟label讀進來了,那麼接下來就是要處理data的問題。 1. 處理音檔 接下來我們將音檔loa...

2024-08-11 ‧ 由 jeremylee 分享
DAY 8

[Day8] pytorch lightning介紹 - 1

前情提要: 昨天已經大致上把Dataset的部分講完了,舉了一個以聲音為主的範例,如何從txt裡面load對應的音檔,最後讓size保持一致。 今天開始介紹py...

2024-08-12 ‧ 由 jeremylee 分享
DAY 9

[Day9] pytorch lightning (實作) - 2

前情提要: 昨天已經完成model.py, dataloader.py, 我自己習慣分成這兩個檔案,因為等到之後model的code越來越多,已經不適合跟tra...

2024-08-13 ‧ 由 jeremylee 分享
DAY 10

[Day10] pytorch lightning 實作 - 3

前情提要: 昨天基本上已經把大部分的code都寫完了,應該可以感受到lightning的簡潔。 1. loss_fn 在training_step跟valida...

2024-08-14 ‧ 由 jeremylee 分享