今天來談談資料的串流服務-AWS Kinesis。Kinesis可用來蒐集即時性且大量的資料,如IoT或者應用程式的log檔。
Kinesis Data Streams
適合資料傳送有real time需求的服務。資料by default可保留24小時,最多可以保留365天。
Kinesis Data Firehose
適合有大量資料串接的服務。能在near real time(至少一分鐘)與automatic scaling的條件下,將資料拋送到S3、Redshift、Elastic Search、Splunk等資料儲存站。資料在Firehose是無法做保留。
Kinesis Analytics
運用SQL語法,在IAM控管資料取得權限下,auto scaling與real time來做資料解析,例如異常資料分析或資料分布密度。此外,也可透過SQL語法,進行資料的ETL。
Kinesis Video Stream
real time串接影像資料到ML應用上。資料在這邊可以保留一小時到十年。
Kinesis的四大資料串接服務,根據需求,可以有不同的排列組合與互動關係。下圖舉例說明:
綠色表示資料產製方,黃色是ML應用端或資料倉儲或應用端,紅色則是Kinesis的服務。