iT邦幫忙

big data相關文章
共有 48 則文章

技術 RegEx:如何從TXT文件或字符串中提取所有電子郵件地址

現在,您有一個混合了電子郵件地址和文本字符串的文本文件,並且您想要提取電子郵件地址。 在本文中,我將向您展示如何使用正則表達式從TXT文件或字符串中提取所有電子...

技術 數據挖掘需要的10項必備技能

數據挖掘是從巨大的數據集中提取有效信息,並將信息轉換為潛在有用且最終可理解的模式以供進一步使用。它不僅包括數據處理和管理,還涉及機器學習,統計和數據庫系統的智能...

技術 Big Data: 70 Amazing Free Data Sources You Should Know for 2019

Every great data visualization starts with good and clean data. Most people beli...

技術 簡易模板: 點擊即可采集網頁數據

If you were an Amazon seller, would you want to know the listing price of a prod...

鐵人賽 影片教學 DAY 19

技術 雲端大數據 (1/2)

[Day 19] 雲端大數據 1.0:穿戴物聯的後端更精彩 (8min) -- ICT系統元素與角色 -- DevOps 1.1:大數據 (30min) --...

活動 大數據分析應用講座 | 4/26 (四) Nextlink Big Data Seminar

活動介紹 Nextlink 聯合世界市占第一雲端平台 AWS 與據分析領導者 Tableau, 強強聯手本次數據分析應用講座。邀請大數據領域的專家, 深入淺...

鐵人賽 Big Data DAY 30

技術 [第 30 天] 深度學習(4)卷積神經網絡與鐵人賽總結

我們今天會練習使用神經網絡的套件 TensorFlow 來建立我們的第一個深度學習模型:卷積神經網絡(Convolutional Neural Network,...

鐵人賽 Big Data DAY 29

達標好文 技術 [第 29 天] 深度學習(3)MNIST 手寫數字辨識

我們今天繼續練習神經網絡的套件 TensorFlow,在學習過程中,不論是視覺化或者機器學習的主題,我們使用了幾個常見的玩具資料(Toy datasets),像...

鐵人賽 Big Data DAY 28

技術 [第 28 天] 深度學習(2)TensorBoard

我們今天繼續練習神經網絡的套件 TensorFlow,在昨天的第一個實作中我們建立一個很單純的神經網絡,利用梯度遞減(Gradient descent)的演算法...

鐵人賽 Big Data DAY 27

技術 [第 27 天] 深度學習 TensorFlow

在過去幾天我們與功能強大的機器學習套件 scikit-learn 相處得還算融洽,不難發現我們對於 scikit-learn 的認識其實僅止於冰山一角,它有著包...

鐵人賽 Big Data DAY 26

技術 [第 26 天] 機器學習(6)隨機森林與支持向量機

我們今天繼續練習 Python 的 scikit-learn 機器學習套件,延續 [第 25 天] 機器學習(5)整體學習,討論倍受歡迎的分類器隨機森林(Ran...

鐵人賽 Big Data DAY 25

技術 [第 25 天] 機器學習(5)整體學習

我們今天仍然繼續練習 Python 的 scikit-learn 機器學習套件,還記得在 [第 23 天] 機器學習(3)決策樹與 k-NN 分類器中我們建立了...

鐵人賽 Big Data DAY 24

技術 [第 24 天] 機器學習(4)分群演算法

我們今天依舊要繼續練習 scikit-learn 機器學習套件,經過三天的監督式學習(迴歸與分類)實作,稍微變換一下心情來練習非監督式學習中相當重要的分群演算法...

鐵人賽 Big Data DAY 23

技術 [第 23 天] 機器學習(3)決策樹與 k-NN 分類器

我們今天要繼續練習 scikit-learn 機器學習套件,還記得在昨天有提到 Logistic 迴歸雖然冠有迴歸的名稱,但實際上是一個二元分類(Binary...

鐵人賽 Big Data DAY 22

技術 [第 22 天] 機器學習(2)複迴歸與 Logistic 迴歸

我們今天要繼續使用 scikit-learn 機器學習套件延續昨天的線性迴歸,練習一個複迴歸以及一個 Logistic 迴歸。如果你還記得 scikit-lea...

鐵人賽 Big Data DAY 21

達標好文 技術 [第 21 天] 機器學習 玩具資料與線性迴歸

我們在 [第 17 天] 資料角力提過,資料角力的目的是為了視覺化或者機器學習模型需求,必須將資料整理成合乎需求的格式。資料視覺化聽來直觀,那麼關於機器學習呢?...

鐵人賽 Big Data DAY 20

技術 [第 20 天] 資料視覺化(3)Bokeh

我們前兩天討論的 matplotlib 與 Seaborn 套件基本上已經可以滿足絕大多數的繪圖需求,唯一美中不足的一點是這些圖形都是靜態(Static)的,如...

鐵人賽 Big Data DAY 19

技術 [第 19 天] 資料視覺化(2)Seaborn

使用 matplotlib 建立一個圖表的概念是組裝它提供的基礎元件,像是圖表類型、圖例或者標籤等元件。 Seaborn 套件是以 matplotlib 為基礎...

鐵人賽 Big Data DAY 18

技術 [第 18 天] 資料視覺化 matplotlib

在我們昨天的文章 [第 17 天] 資料角力有提到,進行資料角力(Data wrangling)的目的多半是為了後續的資料視覺化或者建立機器學習的模型。R 語言...

鐵人賽 Big Data DAY 17

技術 [第 17 天] 資料角力

我們現在面對表格式資料(Tabular data),Excel 試算表,JSON 或者網頁資料時有了相當程度的自信,透過 pandas、requests 與 B...

鐵人賽 Big Data DAY 16

技術 [第 16 天] 網頁解析

並不是所有的資料都能這麼方便地以表格式資料(Tabular data),EXCEL 試算表或者 JSON 載入工作環境,有時候我們的資料散落在網路不同的角落裡,...

鐵人賽 Big Data DAY 15

技術 [第 15 天] 載入資料

截至目前為止我們在學習筆記練習的資料結構,不論是 Python 內建的 list,tuple 或 dictionary,還是引用 numpy 套件與 panda...

鐵人賽 Big Data DAY 14

技術 [第 14 天] 常用屬性或方法(3)Data Frame

除了 Python 基本的資料結構(list,tuple 與 dictionary)以及昨天學習筆記提到的 ndarray,還記得我們在 [第 06 天] 資料...

鐵人賽 Big Data DAY 13

技術 [第 13 天] 常用屬性或方法(2)ndarray

我們在昨天的學習筆記討論了 Python 基本變數類型與資料結構可以應用的屬性或方法,除了基本的資料結構以外,你是否還記得 Python 可以透過引入 nump...

鐵人賽 Big Data DAY 12

技術 [第 12 天] 常用屬性或方法 變數與基本資料結構

我們終於對物件(Objects)以及屬於她的屬性(Attributes)與方法(Methods)有了一定程度的瞭解,這對於非開發者背景的 R 語言使用者可是一個...

鐵人賽 Big Data DAY 11

達標好文 技術 [第 11 天] 物件導向(2)Python

Everything in Python, from numbers to modules, is an object. Bill Lubanovic 經歷...

鐵人賽 Big Data DAY 10

技術 [第 10 天] 物件導向 R 語言

R, at its heart, is a functional programming language. Hadley Wickham R 語言本質上是...

鐵人賽 Big Data DAY 1
迴歸分析與建模入門 系列 第 1

技術 DAY01: 大數據(Big Data)介紹 -1

人們每天上傳至雲端的檔案數量,多達一億張相片、十億份文件… 更別提數位影音、交易、生物醫療… 每天全球所創造的資料量高達2.5艾位元組(exabyes, 即10...

鐵人賽 Big Data DAY 9

技術 [第 09 天] 函數(2)

一但體驗到自訂函數的威力與函數型編程的美觀,似乎開始有種回不去的感覺,好想要回頭把過去撰寫的每一段程式都拿來改寫成函數型編程的結構。我們再多花一天的時間研究函數...

鐵人賽 Big Data DAY 8

技術 [第 08 天] 函數

早在 [第 02 天] 基本變數類型我們就開始使用 Python 的內建函數(generic functions),像是我們使用 help() 函數查詢文件以及...