我們講到 Speed Layer 就像一隊外送員,專門把 Kafka 新鮮出爐的訂單火速送到資料庫。但是,衝得快不代表不會翻車。今天我們來看第三種真實會發生的「...
在鐵人賽倒數兩天,我們稍微把視角轉向 3D 世界。
傳統的 3D 內容創作和渲染,依賴於像網格 (mesh)、體素 (voxel)、點雲 (point clou...
資料前處理步驟說明
在上一篇文章中,我們已經完成資料的整併,但仍有一些格式不一致之處,或需要確認是否存在遺漏值並刪除。可以透過以下方式進行檢查。
Step 1...
在前面幾天,我們介紹了全連接神經網路 (FCNN) 與卷積神經網路 (CNN)。這些架構在處理結構化數據或影像資料上非常成功,但若應用到「序列資料」時就顯得不足...
Trino + Iceberg on S3
查詢引擎百百種為何選中了 Trino 搭配 Iceberg 的組合呢?在先前的系列文《從倉儲到湖倉,初探Trin...
今天我們不聊算法,也不聊推薦系統,我們聊真正讓系統活起來的幕后英雄——資料。
再強的AI 模型,也只能靠資料 —— 也就是每天乖乖整理、解析、結構化的 PDF...