大部分的人對於資料開始產生興趣,不外乎就是因為想要預測未來。 (https://www.livebitcoinnews.com/bitcoin-price-an...
Day8來講講彙總資料aggregate是甚麼吧 在我們整理完資料後, 資料會一列一列的呈現出來, 例如範例資料可以看到我們整理出來的表格有交易日, STORE...
前言 再介紹Azure是什麼之前,我們要先了解什麼是雲端服務 雲端服務 雲端服務:是一種符合商業需求的網路作業服務,讓使用者不用購買軟體,只需透過電腦連接遠端伺...
昨天提到了怎麼開發預測模型,但模型絕對不是開發完就好,後續還有非常多的事情得做。 Deployment 模型在部署時真的非常麻煩。 Build 出來的模型往往...
Hi, day11要來介紹tableau prep中的TRIM函式,這個函式可以去除字串前面&後面的空格, 在遇到需要處理字串長度的狀況可以使用到 TR...
前面我們花了好幾篇的篇幅在介紹原始資料、加工資料、資料模型,但這些都還沒有辦法讓資料真正發揮價值,要讓資料發揮價值一定是要將「資料」與「決策」相互結合。我們接下...
特別把描述模型和預測模型分開來寫是因為兩者在開發與驗證階段有不小的差異。(https://ubiq.co/analytics-blog/create-opera...
資料的層次 2020 年受邀到台北商業大學授課,當時為了讓同學們了解「資料的層次」,以及“data”、“information”、“file”與“Big dat...
Day9我們來聊聊甚麼是聯結資料(join) 聯結資料意思是兩個表格之間有至少一個或以上的欄位是有關連(相同)性的, 那麼就可以透過有關連性的欄位將資料表格橫向...
(https://www.manmonthly.com.au/news/graphene-helps-enhance-wear-resistance-minin...
大量的資料勢必可能來自不同資料源,在結構化資料庫的世界常用的就是聯合查詢。那如果我的資料不全都在結構化資料庫呢?介紹到現在許多人一定會想到強大的儲存系統S3,如...
今天來細看 DataOps 的原則,盡量會搭配過去實作的經驗一起做說明。 1. 持續地滿足客戶需求 我們最優先的任務是透過及早並持續地交付有價值的分析洞察來滿足...
如同前面所說,資料模型需要運用到實際環境中才會發揮價值 Initiation 延續之前模型的初始條件,如果想使用資料來輔助決策,最重要的就是要釐清想解決的問題是...
儘管都是模型,但預測模型目的在於預測未來,所以開發方式也會和描述型模型有所差異。 Initiation 起始階段要確認的事情跟之前差不多。 商業意圖是否明確:商...
雲端的分類 第一次點開AWS官網( https://aws.amazon.com/ )或許會有點眼花撩亂,因為在不同的使用場景,對雲端的分類會有不同的用法。維基...
對於「半結構化」類型的資料可以存放至NoSQL 資料庫*之中。NoSQL 資料庫常見於需要較快寫入速度的應用場景;半結構化資料本身少了關聯式資料庫那種schem...
過了需求訪談後,在設計和開發階段也有要注意的事項。 第一坑 資料不熟悉 當組織規模一大,設計資料產品的人可能需要從其他人的手伸認識資料,這種時候就會發生很多誤解...
Hi, day12我們來講更進階的正則表達式這次會用到以下這兩個函式REGEXP_REPLACE(多重自訂規則取代字元)REGEXP_EXTRACT(多重自訂規...
首先對本篇主題中的一些常見名詞與討論角度做基本的定義;建立共同的出發點以利文章閱讀,並直接破題回答,或許很多人看到標題會有得疑問 : 為什麼要在雲端平台上做數據...
前言 1. What is Pyspark ? PySpark 顧名思義,也就是Python 的一個Spark Library,主要是利用Python語法結合S...
如同軟體需要硬體,資料分析的基石就是資料儲存。在處理的過程中,資料(data)需要在長期或暫時性的儲存地之間轉換才能順利且有效得被處理。隨著軟硬體科技的進步,各...
如果有疑惑說:資料湖與資料倉儲該如何選擇呢?其實它們並不衝突。因為存放的資料不同,可以做的分析也不同,所以資料湖更像是資料倉儲的延伸,感謝分析技術的進步,現在可...
架構圖 record.json 救回來 json_load() load 出來 代表資料齊全,沒出來 代表手動繼續補 import json with ope...
前言 上一篇介紹完雲端服務後,這一篇文章我想要介紹Azure雲端服務到底提供什麼功能,讓大家知道它可以運用在什麼地方,但其Azure可以延伸應用非常多,這邊只是...
前言 那其實我這次報名競賽的題目為Azure的介紹以及應用,主題選的是AI&Data,那問題就來了,AI跟Data到底跟Azure有什麼關係呢? Azu...
如同前面所說,資料模型需要運用到實際環境中才會發揮價值 Initiation 延續之前輔助決策的初始條件,如果想使用資料來做自動決策,最重要的一樣是要釐清想解決...
在資料分析的過程中,花最多時間的事就是在理出資料處理的邏輯,要花很多時間與資料互動,就像第二天提到資料探勘流程中的三個階段:資料準備(Data Preparat...
在評估階段有幾件面向需要注意 資料產品品質 資料產品品質是需要持續監控和評估的。不同層的資料產品有不同的品質指標,基本上很難一次到位,需要持續增加觀察的指標。例...
相較於資料湖,另一個更常見的大數據儲存系統是 — 資料倉儲。和資料湖一樣,資料倉儲也用來儲存巨量資料,但一個明顯的區別是,它是儲存傳統常見的結構化資料,像是表格...
Store location data is information about the geographical locations of retail bu...