在深入探討卷積神經網路 (CNN) 之前,我們先回顧一個用於手寫數字識別的基礎模型:全連接網路。
全連接網路處理 MNIST 資料集在處理 MNIST 資料集...
今天要講上次講TCP時沒講到的UDP以及在UDP上面跑的QUIC而我們今天也會將UDP與TCP進行比較,那就事不宜遲,開始今天的介紹吧。
什麼是UDP?
UDP...
農委會規定農產品業者供應校園食材、國軍副食、超商、超市、量販店、大賣場及網購通路販售的洗選鮮蛋,都得要在進入通路前在「台灣雞蛋溯源平台系統」登錄資訊,並且要在蛋...
繼前一篇小結了一下概念,誠如前一篇所述,接下來將實際做做看一個 LLM。以下的段落會以最有名的 Transformer 架構為例,來逐步打造其中的不同模組,而第...
現行的注意力機制不單只計算一次上述的注意力,而是分頭進行多次計算,並使用不同的投射來重複執行。
最簡單的多頭注意力
透過 Module List 並傳入 num...
6. frozenset(): 建立不可變集合
✦ 指令功能 : 建立不可修改元素之集合
✦ 使用時機 : 作為字典的鍵 (key)、設定常數集合等
7. s...