iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

利用 Databricks 學習 ML/LLM 開發 系列

Databricks 已經是目前 Machine Learning / LLM 的開發工具主流之一,也從很多客戶的使用回饋得知,還很多人只會簡單的操作。這系列希望能夠從作者在參與客戶專案與公司專案的過程中,帶著讀者從零到一開始。(From Zero to Hero)

鐵人鍊成 | 共 30 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day01 - 寫在之前: 為何您需要知道 "利用 Databricks 學習 ML/LLM 開發" 這篇系列文?

Machine Learning (機器學習) 經過這幾年的發展,已經不再是一個新鮮的名詞,而是一個被廣泛使用的技術。在這個系列文中,我們將會介紹如何使用 Da...

2023-09-16 ‧ 由 jimmyliao 分享
DAY 2

Day02 - Databricks 簡介以及基本觀念

Big Data 的主流技術之一,就是 Apache Spark。而 Databricks 就是由 Apache Spark 的創始人所創立的公司,並且提供了一...

2023-09-17 ‧ 由 jimmyliao 分享
DAY 3

Day03 - 申請 Databricks Community Edition

Databricks Community Edition 是免費的,但是需要申請帳號,才能使用。申請的方式很簡單,只要到 Databricks 官網,點選 Ge...

2023-09-18 ‧ 由 jimmyliao 分享
DAY 4

Day04 - Databricks 基本觀念、操作、關鍵元件

Databricks 基本架構圖如下: 基本觀念需要了解的有: Accounts and workspaces一個 workspace 就是一個 Datab...

2023-09-19 ‧ 由 jimmyliao 分享
DAY 5

Day05 - 建立 Cluster 與 SQL Notebook 驗證 Cluster/Spark 環境

登入 Databricks Community Edition (CE) Portal 後,參考 Getting Started document,建立一個 c...

2023-09-20 ‧ 由 jimmyliao 分享
DAY 6

Day06 - DataBricks Runtime ML 在 Community Edition (CE) 和 Subscription Edition (SE) 的差異

Databricks Runtime for Machine Learning (Databricks Runtime ML) 是一個已經包含了機器學習相關的套...

2023-09-21 ‧ 由 jimmyliao 分享
DAY 7

Day07 - 一個利用 Databricks MLflow tracking 的範例

本篇會使用 Reproduce Anything: Machine Learning Meets Data Lakehouse 這篇 Sample Notebo...

2023-09-22 ‧ 由 jimmyliao 分享
DAY 8

Day08 - 透過 Experiment 畫面查看實驗結果與分析

由於 train.py 是用 RandomForestRegressor,我們可以先簡單調整 n_estimators 來觀察實驗結果。 先調整成 10000...

2023-09-23 ‧ 由 jimmyliao 分享
DAY 9

Day09 - 佈署模型上線

先點選左方的 Model 功能表,再點選右上角的 Use Model For Inference。 先選擇 Real-time inference,再選...

2023-09-24 ‧ 由 jimmyliao 分享
DAY 10

Day10 - Databricks 到底是什麼?

到了第十天,從前面幾篇透過範例可以快速跑 Machine Learning model 之後。我們來複習一下 Databricks 到底是什麼? 從 Getti...

2023-09-25 ‧ 由 jimmyliao 分享