累計文章數 20,379篇
參賽組數 1087組
團隊組數 052隊
完賽人數 572 人
前一天我們就如何讓程式可以認得不同的單字稍微討論了一下一些基本的處理,那今天我們就繼續文字的主題來介紹一個在處理文字資料的時候非常強大的工具——正規表示式(又稱...
NiFi 除了可以向 DB、Data Storage 存取資料之外,很多場景可能也需要接收 API 的資料或是發送 API,所以今天這篇來介紹一下 NiFi 如...
Day2 環境架設 前言 一般來說,蠻多人會用Jupyter notebook來進行Python的入門,因為它可以建Cell,這邊Cell就是程式碼的一段區塊,...
Introduction 在這個課程裡,會學到最熱門的資料分析套件,pandas Getting Start import 套件 import pandas a...
一、為什麼要拆分成三個資料集? 我們用一個比喻來說明3種資料集之間的關係: 訓練集相當於上課學的知識。 驗證集相當於段考、模擬考,用來對你的學習方法進行驗證、...
一、異常值(Outliers) 異常值是指某些大幅度偏離正常值的資料點,來源可能是測量異常或記錄異常由於該值容易導致模型偏離正常值的預測,因此濾除異常值通常是進...