從 Ray 2.3.0 之後,開始支援 Apache Spark Cluster,也讓原本使用 Spark 進行分散式機器學習訓練的工作,可以透過 Ray 來取...
~今天要分享的是「深度學習」~
在鐵人賽最後的兩篇文章,我想向大家介紹深度學習的觀念,這部分在iPAS「中級巨量資料分析師」的考試中佔了10%的分數,所以大家也...
Taipei dbt Meetup 是由 Karen, Laurence, 和 Allen 帶頭開始的,當時台灣還很少人用過 dbt。因為他們在 Slack 申...
NLP主要演算模式
編碼器與解碼器模式
序列對序列的模式(Sequence to Sequence Model, Seq2Seq):由輸入的序列性資料(Inp...
簡介
在研究 LLM 相關的授權條款時,主要有三個方向:程式碼的授權、資料集的授權與模型權重的授權。有些相對嚴謹的專案,會將這三種東西的授權設定成不同的授權,而...
在 Day 4, 我談到為何選擇 dbt, 今天想來反向聊一下,那 dbt 為何選擇我這種,從 PM 轉進資料人。在 Day 24 也有聊到,dbt 的誕生是為...