Iceberg 的效能問題
延續昨日我們對 Metadata 讀取 以及 Trino Splits 概念之介紹,我們知道Splits 數量一旦過多,將很可能會...
終於來到這個系列的最後一天。老實說,如果要我替這 30 天打個分數,我大概只會給自己一個 勉強及格。原因很簡單: 這個系列從一開始就有宏大的規劃與期待,但在實際...
隨著大型語言模型(Large Language Models, LLMs)的爆炸性發展,過去認為需要數百張 GPU卡,如今已經能在一台筆電、甚至手機上跑起來。這...
原本我們的即時數據儀表板就像一個簡潔的咖啡店櫃台 - 只顯示今天賣了多少杯咖啡(orders)。老闆每天早上都會滿意地看著螢幕上跳動的數字,點點頭說:「嗯,生意...
現實中的視覺任務,往往遠比我們前幾天所做的圖像分類還複雜,例如物件偵測:不只要知道圖片有一隻貓,還要知道貓在哪裡。物件偵測的目標是同時在一張圖片完成兩件事...
前言
在上一篇文章中,我們已經完成了資料欄位的統一。今天的任務,就是把 App Store 和 Google Play 的資料合併成一份完整的 DataFram...