iT邦幫忙

2023 iThome 鐵人賽

DAY 4
0

今天來談談資料的串流服務-AWS Kinesis。Kinesis可用來蒐集即時性且大量的資料,如IoT或者應用程式的log檔。

Kinesis Data Streams
適合資料傳送有real time需求的服務。資料by default可保留24小時,最多可以保留365天。

  • Provisioned Mode:自己定義要使用多少shard來做資料的輸送。(每秒最多可接收1MB,每秒最多可輸出2MB)
  • On-Demand Mode:自動化調整資料輸送的頻寬。(default頻寬是每秒4MB)

Kinesis Data Firehose
適合有大量資料串接的服務。能在near real time(至少一分鐘)與automatic scaling的條件下,將資料拋送到S3、Redshift、Elastic Search、Splunk等資料儲存站。資料在Firehose是無法做保留。

  • 可透過AWS Lambda服務進行資料的前處理。
  • 資料如果是傳送到S3,能進行資料的壓縮處理。

Kinesis Analytics
運用SQL語法,在IAM控管資料取得權限下,auto scaling與real time來做資料解析,例如異常資料分析或資料分布密度。此外,也可透過SQL語法,進行資料的ETL。

Kinesis Video Stream
real time串接影像資料到ML應用上。資料在這邊可以保留一小時到十年。

Kinesis的四大資料串接服務,根據需求,可以有不同的排列組合與互動關係。下圖舉例說明:
綠色表示資料產製方,黃色是ML應用端或資料倉儲或應用端,紅色則是Kinesis的服務。
https://ithelp.ithome.com.tw/upload/images/20230919/20111554o2kGcrJUnb.png


上一篇
Day 3 第一站 Data Engineering - S3 Security
下一篇
Day 5 第一站 Data Engineering - Glue
系列文
夥伴們!一起航向AWS Certified Machine Learning Specialty的偉大航道吧!30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言