Databricks 已經是目前 Machine Learning / LLM 的開發工具主流之一,也從很多客戶的使用回饋得知,還很多人只會簡單的操作。這系列希望能夠從作者在參與客戶專案與公司專案的過程中,帶著讀者從零到一開始。(From Zero to Hero)
Machine Learning (機器學習) 經過這幾年的發展,已經不再是一個新鮮的名詞,而是一個被廣泛使用的技術。在這個系列文中,我們將會介紹如何使用 Da...
Big Data 的主流技術之一,就是 Apache Spark。而 Databricks 就是由 Apache Spark 的創始人所創立的公司,並且提供了一...
Databricks Community Edition 是免費的,但是需要申請帳號,才能使用。申請的方式很簡單,只要到 Databricks 官網,點選 Ge...
Databricks 基本架構圖如下: 基本觀念需要了解的有: Accounts and workspaces一個 workspace 就是一個 Datab...
登入 Databricks Community Edition (CE) Portal 後,參考 Getting Started document,建立一個 c...
Databricks Runtime for Machine Learning (Databricks Runtime ML) 是一個已經包含了機器學習相關的套...
本篇會使用 Reproduce Anything: Machine Learning Meets Data Lakehouse 這篇 Sample Notebo...
由於 train.py 是用 RandomForestRegressor,我們可以先簡單調整 n_estimators 來觀察實驗結果。 先調整成 10000...
先點選左方的 Model 功能表,再點選右上角的 Use Model For Inference。 先選擇 Real-time inference,再選...
到了第十天,從前面幾篇透過範例可以快速跑 Machine Learning model 之後。我們來複習一下 Databricks 到底是什麼? 從 Getti...