iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

利用 Databricks 學習 ML/LLM 開發 系列

Databricks 已經是目前 Machine Learning / LLM 的開發工具主流之一,也從很多客戶的使用回饋得知,還很多人只會簡單的操作。這系列希望能夠從作者在參與客戶專案與公司專案的過程中,帶著讀者從零到一開始。(From Zero to Hero)

鐵人鍊成 | 共 30 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day11 - Databricks 上的 Data Engineering

到了第十一天,我們來看看 Databricks 上的 Data Engineering。從官方網站介紹來看,有底下幾個部分 Delta Live Tables...

2023-09-26 ‧ 由 jimmyliao 分享
DAY 12

Day12 - Delta Live Tables (DLT) 簡介

Delta Live Tables 是一個 Delta Lake 的資料表,可以透過 SQL 來進行資料的操作。這個資料表可以透過 SQL 來進行資料的操作,並...

2023-09-27 ‧ 由 jimmyliao 分享
DAY 13

Day13 - Run first Delta Live Tables pipeline

此篇是參考 Referenece 1. 的內容,實際操作一次 Delta Live Tables 的 pipeline。 0. Prerequisites 必...

2023-09-28 ‧ 由 jimmyliao 分享
DAY 14

Day14 - Databricks Workflows 簡介

此篇是參考 Referenece 1 & 2 的內容,並實際操作之後的心得分享。 Databricks Workflows 是一個可以用來建立 data...

2023-09-29 ‧ 由 jimmyliao 分享
DAY 15

Day15 - Databricks Workflows 操作

Databricks Jobs 的建立與執行 首先,先注意底下幾個限制: 一個 workspace 只能有 1000 個同時執行的任務,如果超過這個數量,就會...

2023-09-30 ‧ 由 jimmyliao 分享
DAY 16

Day16 - Databricks Workflows 進階操作

Implement data processing and analysis workflows with Jobs 利用 Jobs 來建立資料處理與分析的工作...

2023-10-01 ‧ 由 jimmyliao 分享
DAY 17

Day17 - Databricks Repos

Databricks Repos 是一個視覺化的 Git 客戶端,並且提供 API。它支援常見的 Git 操作,例如複製存儲庫、提交和推送、拉取、分支管理以及提...

2023-10-02 ‧ 由 jimmyliao 分享
DAY 18

Day18 - Databricks Repos 功能細項討論與限制

由於官網的文件只有英文,但是內容非常實用,今天這篇先來將需要的資訊簡單翻譯說明一下。(註:已經消化整理,並非完整翻譯) File and repo size l...

2023-10-03 ‧ 由 jimmyliao 分享
DAY 19

Day19 - Databricks 上的 Storage

先提供一個快速的列表,說明哪些資料會被存到哪裡: Operation Location 在 UI 上傳檔案 Object storage 在...

2023-10-04 ‧ 由 jimmyliao 分享
DAY 20

Day20 - Databricks Machine Learning (Databricks ML) 簡介

在一開始的幾篇,有透過一個簡單的範例來說明如何使用 Databricks 的機器學習功能。這篇會從基本觀念說明 Databricks 的機器學習功能。 Dat...

2023-10-05 ‧ 由 jimmyliao 分享