透過線上課程筆記的整理,與tech community分享ML Specialty考照的重點資訊。內容將包含AWS雲端服務與ML的基礎實務。一起拿到One Piece吧!
在資料科學界翻滾多年,玩了AWS不少服務,也在Edge端摸索許久,卻一直還沒下定決心來征服這一張號稱極有挑戰的證照-AWS Certified Machine...
提到資料工程,怎麼擺資料是一大課題。今天就跟大家介紹一下AWS鼎鼎大名的S3資料儲存服務。 可以放多大資料上去?AWS S3提供無限擺放資料的空間,但單一筆上傳...
S3 提供一系列安全存取資料的機制。S3資料管理者可以透過IAM Policy或者Bucket Policy來決定賦予使用者多少權限來去操作資料。此外,我們也可...
今天來談談資料的串流服務-AWS Kinesis。Kinesis可用來蒐集即時性且大量的資料,如IoT或者應用程式的log檔。 Kinesis Data Str...
談到ETL(Extract, Transform, Load),就不能不提到AWS Glue。簡單來看,Glue有兩個主要功能: 1. Glue Crawler...
Machine Learning的資料儲存服務,除了第二天所提到的S3服務以外,還有其他另外五種,這邊也跟大家進一步的分享和比較之間的差別。 1. S3採Ser...
除了先前提到的Glue以外,AWS上還有其他根據資料處理目的而設計的資料搬動與串接服務。以下分別跟大家說明: AWS Data Pipeline能拉動local...
資料型別主要有三種,Numerical、Categorical與Ordinal。以下分別跟大家說明: Numerical Data數值型的資料,具有數學意義,可...
了解資料的分佈,有助於我們進行資料清洗或者Machine Learning演算法的選擇。例如,Gaussian Naive Bayes假設資料的分佈是常態分佈。...
時間序列資料充斥在我們生活中的各個應用場景,熱門的股票價格分析、日常的氣溫變化、特定關鍵字搜尋次數的時序變化等等。這裡提供三種時間序列的特性: 1. Trend...