技術問答
技術文章
iT 徵才
Tag
聊天室
2023 鐵人賽
登入/註冊
問答
文章
Tag
邦友
鐵人賽
搜尋
2021 iThome 鐵人賽
DAY
26
0
DevOps
中台化轉型
系列 第
26
篇
大數據平台:資料倉儲
13th鐵人賽
HO-HSUN
2021-09-26 02:16:36
680 瀏覽
Hive
適用於 PB 等級大數據的儲存,分析和查詢,處李日誌分析和用戶行為模型訓練。
SQL 語法支援
將查詢語法轉換為「抽象語法樹(Abstract Syntax Tree, AST)」以及使用者自定義函式(User-Defined Function, UDF) 產生執行計畫。
結構化資料模型
透過 MetaStore 管理系統元資料,將實際資料儲存於 HDFS,支援多種資料格式:TextFile、SequenceFile、ORCFile、Parquet 和 Avro。
資料運算模組
支援 MapReduce、Spark。
Presto
適用於 GB 到 TB 等級的資料量,在需要即時回應的資料查詢場警,提升商業化服務。
使芿基於「記憶池(Memory Pool)」的資料模型。
系統架構:
Cordinator:負責語法解析產生執行計畫,節點(Worker)管理及任務分發。
Worker:負責與 Hive 和 HDFS 互動,執行任務及實際運算。
SQL 查詢優化,提高系統問定性和執行效率,支援不同資料來源的即時跨平台資料計算。
留言
追蹤
檢舉
上一篇
大數據平台:分散式協調
下一篇
大數據平台:分散式計算
系列文
中台化轉型
共
30
篇
目錄
RSS系列文
訂閱系列文
6
人訂閱
26
大數據平台:資料倉儲
27
大數據平台:分散式計算
28
大數據平台:分散式檔案
29
大數據平台:訊息中介
30
大數據平台:叢集管理
完整目錄
直播研討會
{{ item.subject }}
{{ item.channelVendor }}
{{ item.webinarstarted }}
|
{{ formatDate(item.duration) }}
直播中
立即報名
尚未有邦友留言
立即登入留言
iThome鐵人賽
參賽組數
1123
組
團體組數
52
組
累計文章數
23096
篇
完賽人數
656
人
看影片追技術
看更多
{{ item.subject }}
{{ item.channelVendor }}
|
{{ formatDate(item.duration) }}
直播中
熱門tag
看更多
15th鐵人賽
13th鐵人賽
14th鐵人賽
12th鐵人賽
11th鐵人賽
鐵人賽
2019鐵人賽
2018鐵人賽
javascript
2017鐵人賽
python
windows
php
c#
windows server
linux
css
react
程式設計
vue.js
熱門問題
不是內部或外部命令、可執行的程式或批次檔。上網查了很多但都無法解決也不知道為什麼,煩請各位大神幫幫我,感激不盡。
感覺AI要導致廢物如我失業了
如何在進入系統前擋住USB開機
Chrome 無法連上非Google網站
想請問有關用 PowerShell 達成自動化的指令,懇請高手賜教,十分感謝!
微服務、敏捷開發成本概念
JSON資料儲存關聯式資料庫(MSSQL)
關於掃瞄器
請問如何在老Tiptop系統,要新建一家公司要怎麼做?
市面上有裡一張10g pcie網卡友支援vm的呢?
熱門回答
不是內部或外部命令、可執行的程式或批次檔。上網查了很多但都無法解決也不知道為什麼,煩請各位大神幫幫我,感激不盡。
Chrome 無法連上非Google網站
感覺AI要導致廢物如我失業了
如何在進入系統前擋住USB開機
JSON資料儲存關聯式資料庫(MSSQL)
熱門文章
用合法動作掩飾非法行為,這4種業務邏輯安全漏洞,穿過保護機制套利提權
在 Production 環境使用 Docker 需要注意的大小事
建立虛擬機 in Cent OS by KVM
搭建 Kubernetes 環境 透過 kubeadm 基於 CentOS
某牌DVR被打爆,使用Vigor Router firewall 防火牆可以這麼做,DVR還可以繼續用
IT邦幫忙
×
標記使用者
輸入對方的帳號或暱稱
Loading
找不到結果。
標記
{{ result.label }}
{{ result.account }}