雖然之前看到部份的資料分析職位只需要對 excel 很熟悉即可,但我覺得對於資料庫拉取資料的這個層面 SQL 是蠻必要的 ~
我比較常使用的做法是在 jupyter notebbok 中寫 SQL 使用套件將資料拉出進行進一步分析,也有看過有人純用 SQL 進行分析,整個 SQL 變得蠻長而且也蠻複雜的,但很佩服。我比較喜歡邊寫邊看結果的方式。
接下來談談我之前碰到的痛吧
SELECT TOP 10 *
FROM table_name WITH (NOLOCK)
WITH table1 AS (
SELECT ... FROM ...),
table2 AS (
SELECT ... FROM table1)
SELECT ... FROM table2
這裡的 table1 就可以是獨立區塊1,table2 是獨立區塊2,在最後的 SELECT statement 再使用需要用的 table。現在還是有時有點痛的點
參考 :