接下來我們的實作都會在VScode + Github Copilot ,所以一定要準備的 VScode + Github Copilot 不能少。 在覺得最舒服...
前言昨天我們完成資料前處理與特徵工程,現在已經有乾淨且規範的資料可以使用。今天將進入核心步驟:建立邏輯迴歸模型,讓模型學習特徵與目標之間的關係。 一、建立邏輯...
前言昨天完成了開發環境建置,今天我們要開始準備邏輯迴歸的資料。首先從網路下載範例資料檔案,然後導入 Jupyter Notebook,進行初步檢視與簡單視覺化(...
在 Day 5 我們學會了如何抓取 Notion Database 的 Schema 與 rows,並將其清洗成乾淨的 JSON。但光是抓到 Database...
在 Day 3,我們認識了 Notion API,知道它能夠存取 Pages、Databases 與 Blocks。今天,我們要進入實作 - 完成專案的基礎建置...
經過這三十天,您現在應該: 相當熟悉pl.Series及pl.DataFrame兩大型別。 徹底了解pl.DataFrame.select()、pl.Data...
marimo是資料科學領域的新星,可以視為新一代的notebook。其開發速度相當快,每隔一陣子就會有令人驚艷的新功能。 今天我們除了學習marimo的基礎知識...
Pointblank是一款支源多種資料格式的資料驗證套件(註1),由Richard Iannone所開發,並由Posit大力支持。 今天我將分享Pointbla...
今天我們來介紹幾個Turtle Island提供的函數。 本日大綱如下: 本日引入模組及準備工作 ti.make_index() ti.case_whe...
Turtle Island(註1)為小弟編寫的套件,其目的是希望能讓使用者專注地編寫expr,而非處理相關的boilerplate code。 今天我將分享Tu...
想要研究命名空間的動機來自於,在[Day23]及[Day24]使用Plotnine及Great Tables製作關稅表時,會重覆用到如何將奇數及偶數列填上不同顏...
今天延續昨天的主題,換成使用Great Tables搭配Polars來複刻各國關稅表。 本日大綱如下: 本日引入模組及準備工作 Great Tables極簡操...
今明兩天我們將嘗試複刻美國總統Donald Trump於2025年4月2日,在Truth Social上所公布的各國關稅表。 今天將先使用Polars進行資料處...
今天我們使用Plotnine搭配Polars來繪製Alta的歷年溫度變化圖。 本日大綱如下: 本日引入模組及準備工作 Plotnine極簡操作說明 繪製圖片...
今天我們使用Matplotlib搭配Polars來繪製Alta的歷年溫度變化圖。 本日大綱如下: 本日引入模組及準備工作 Matplotlib極簡操作說明 繪...
Matt Harrison出版的Effective Visualization,詳細講解了如何使用Matplotlib繪製Pandas DataFrame。 受...
今天我們來了解Polars的lazy模式。 藉由lazy模式,Polars能事先利用各種最佳化技巧打造最佳的query plan,大幅提升相對於eager模式的...
今天我們來分享一些Polars的進階操作。 本日大綱如下: 本日引入模組及準備工作 邏輯判斷:pl.when().then().otherwise() 元素...
今天我們來說明Polars提供的三種join,分別為「"equi joins"」、「"non-equi joins"」、...
今天我們來說明如何使用pl.DataFrame.pivot()、pl.DataFrame.unpivot()及pl.DataFrame.unstack()。 本...
排序在Polars中是相當重要的概念,因為一旦能夠確定該資料結構是有序的(無論是pl.Series、pl.DataFrame或是pl.Expr),將可以進行許多...
重要提醒:pl.Categorical在v.1.32.0進行了重大變更,本日內容將會以新版使用方式說明(v.1.33.1)。 今天我們來了解pl.Enum與pl...
今天我們來了解與時間有關的型別(在Polars中習慣稱呼其為temporal型別)及操作。 Polars共有四種temporal型別: pl.Date:日期...
今天我們來了解如何使用pl.DataFrame.group_by(),進行聚合運算。 本日大綱如下: 本日引入模組及準備工作 基本聚合 條件式聚合 針對多列或...
今天我們來學習如何使用pl.DataFrame.filter()。 本日大綱如下: 本日引入模組及準備工作 pl.DataFrame.filter()...
今天我們來學習如何使用pl.DataFrame.select()與pl.DataFrame.with_columns(),並會提到相關的expr知識。 本日大綱...
今天我們來了解pl.Array、pl.List及pl.Struct三種容器型別。 本日大綱如下: 本日引入模組及準備工作 pl.Array pl.Lis...
經過了 30 天的探索,我們從傳統電腦視覺開始,一路學習到最近幾年的架構。在鐵人賽最後一天,簡單介紹一下我們未提及但在現在相當重要的議題。 神經渲染與即時光線追...
傳統的檔案存取try … catch … finally … : file = open("example.txt", "r&qu...
今天我們來了解如何利用pl.Expr.str進行pl.String的各種操作。 本日大綱如下: 本日引入模組及準備工作 介紹數個pl.Expr.str提供的e...