Day 13: Apache Kafka - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

DAY 13

0

分散式資料處理，以Stream Computing為例系列第 13 篇

Day 13: Apache Kafka

鐵人賽分散式系統 kafka

2014-10-11 17:28:12

12860 瀏覽

分享至

Apache Kafka 是一個 Distributed Queue 的實現，很多 Stream Computing 平台都支援 Kafka 作為 data source。

Kafka 有幾個特色：

分散式架構，所以天生就是容易擴充的。
基於磁碟空間，且避免隨機存取。
因為儲存空間大，因此Queue裡的資料就算已消耗，也可以不用刪掉。好處包括：其他新加入的consumer可以處理到過去的資料(重要特色)。如果有batch-oriented的consumer (如:Hadoop)，可以一次拉取足夠大量的資料，以利batch的處理效率。
對資料的包裝是輕量級的，且可壓縮。避免掉不必要的物件包覆，可以直接以檔案的型式來處理資料。
因為可以直接處理檔案資料，直接用OS的page cache，不需要額外Applicaion Cache來競爭珍貴的記憶體空間。

接下來的幾天，我會再用之前講過的維度，來介紹Kafka的分散式特徵。

Day 12: Zookeeper (續)

Day 14: Apache Kafka (2)

系列文

分散式資料處理，以Stream Computing為例共 30 篇

目錄

RSS系列文訂閱系列文

25 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙