技術問答
技術文章
iT 徵才
Tag
聊天室
2024 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2021 iThome 鐵人賽
DAY
27
0
DevOps
中台化轉型
系列 第
27
篇
大數據平台:分散式計算
13th鐵人賽
HO-HSUN
2021-09-27 00:16:04
795 瀏覽
分享至
Spark
支援批次資料、查詢分析、資料流、機器學習及圖處理(Graph Processing),以「彈性分散式資料集(Resilient Distributed Datasets, RDD)支援「資料切片」及「資料回朔」等特點,實現了「記憶體內計算(In-memory computing)」及「流程優化(Processes Optimization)」等功能。
Flink
分散式資料流計算架構,在即時的資料查詢、反詐欺、資料分析、線上模型訓練和業務流程監控等場景,提供毫秒等級的運算滿足業務需求。
Beam
一個分散式計算的通用架構,定義了了資料批次處理和資料流處理的「程式編程接口(Application Programming Interface, API)」統一標準,可以對接 Spark 及 Flink。
PCollection
代表資料及與資料流的資料集,只能唯讀循序讀取,每筆資料都會附加時間戳記(Timestamp)。
PTransform
採用函式語言程式設計(Functional Programming)提高系統的可測試性與平行處理效能。
Pipeline
由 PCollection 以及 PTransform 資料處裡的運算流程圖。
留言
追蹤
檢舉
上一篇
大數據平台:資料倉儲
下一篇
大數據平台:分散式檔案
系列文
中台化轉型
共
30
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
26
大數據平台:資料倉儲
27
大數據平台:分散式計算
28
大數據平台:分散式檔案
29
大數據平台:訊息中介
30
大數據平台:叢集管理
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1064
組
團體組數
40
組
累計文章數
22209
篇
完賽人數
600
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
16th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
javascript
2018鐵人賽
python
2017鐵人賽
windows
php
c#
windows server
linux
css
react
vue.js
熱門問題
虛擬機點啟動 卻出現錯誤
PDF影像資料不足
關於pychram 安裝新的anaconda後設定完全亂掉了.求前輩們幫忙查看哪裡設定出錯了.
開啟wifi後在輸入帳密視窗卡住
Outlook 2010 更新到 Outlook 2024 時,行事曆不見了,怎辦?
如何阻止系統再次安裝 KB5048652 更新(或某一個更新)
Outlook 2007 常常無法收寄特定人的信
google擴展,函數無法定義
WINDOWS 10 或以上有沒方法自定義LLDP訊息?
【Glpi】安裝agent時如何直接帶入群組
熱門回答
PDF影像資料不足
關於pychram 安裝新的anaconda後設定完全亂掉了.求前輩們幫忙查看哪裡設定出錯了.
虛擬機點啟動 卻出現錯誤
如何阻止系統再次安裝 KB5048652 更新(或某一個更新)
鐵人賽頒獎典禮
熱門文章
使用LINE發報機房溫度/濕度 過高通知
探索容器資源限制:透過實驗理解 Docker 的 CPU 和記憶體調度 (2)
體驗SQL資料庫Day2:常用資料型態解析和資料操作
體驗SQL資料庫Day1:Table(表)、Row(行)、Column(列)
[一天一學習 直到我完成任務管理系統] Day 2 設定環境
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}