iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 25
3
Elastic Stack on Cloud

後端碼農程序猿,來寫on cloud是不是搞錯了什麼,俺想耕田呀系列 第 25

這篇來介紹關於Elastic on cloud的農具好了,關於Elastic專有名詞說文解字:基本概念篇(上)

  • 分享至 

  • xImage
  •  

昨天前文廢話聊到把想學的事物抽象化

這詞說起來容易,站着講話不腰疼,那該怎麼做呢?

接續昨天,假設我想學前端已前端來說分了三個面向

  1. 關於資料對於畫面的渲染方式
  2. 組件與組件間溝通的方式
  3. 對於原生js的封裝與校調

資料庫則是

  1. 寫入:速度,關聯,準確性
  2. 消耗的物理資源(cpu,ram,硬碟)
  3. 讀取:速度,語句語法,讀取特性

那關於資料結構,演算法那些並沒有所謂"拆分的東西呢?"

  1. 先把所有資料結構或與名詞找出來
  2. 先不去看公式與細部內容,而是大概知道宏觀來說每個是拿來幹嘛的
  3. 總會有些是比較常用,且淺的,體會下什麼是真正的演算法與資料結構

依據上面這些去分析與整理應該去學什麼,然後上網找大地圖去學
今天呢是聊怎麽快速瞭解自己該怎麼去理解一個完全陌生的東西,與立足點在哪
學A框架與B框架,哪個可能是過渡期的東西,如何投資時間再對的技術上


那麼今天的正篇又要開始囉~

到處拿我的文章很不要臉的問別人:誒誒,覺得怎樣?
統一都是回答:看不懂,好難,除了倒排這篇有點頭緒

經過本小農深入叵析與採訪之後,明白大部分的銅學都是矇再專有名詞這塊

那麼事情就簡單了

elastic 每個選手(還有連載的)都有去看

想真正把"elasticsearch"學好學深

可以去看看喬叔的文,真是巨專業,巨有條裡的
每篇都把es的知識點與實現原理與看起來相似卻不同的東西解釋的超清楚
甚至詳細與細緻入微到看起有點煩XDD
完全不像是很不甘怨的被老婆抓來寫的

如果是運維部的看官想把on Cloud可以怎麽維護與運作

則可以去etsaycood的保健室晃晃,真是把on cloud翻來覆去
目前看起來絕對不會因爲不相關on cloud失格的絕對是他

但翻來翻去,好像沒什麼關於elastic相關的名詞詳細說文解字

那這種農具介紹的小事,就交給小農來吧٩(。・ω・。)و

這樣以後教書又可以把自己寫的東西當講義拿去混水摸魚了

觀看其他大神的文章也可以那小農的文章當註解慢慢看

那麼基本概念篇從大到小的開始囉!!

1. 集群(cluster)

好幾個節點則集合成一個集群,集群內節點可互相溝通,遞補與協調,達成一個節點掛了仍有其他節點補上不中斷服務,其中一個集羣可能不只一臺機器,有可能直接是整個機房都是ES的一個集羣

2. 節點(Node)

這東西呢,類似像電腦的執行程序(實例),每個節點代表一個真正的ES實例
類似像很多的應用程序集合成一個作業系統他們彼此各司其職
彼此掛了不影響(除非機器掛了)但又彼此關聯著
類似像同時開了excel與word以及ppt趕着論文
excel算出圖表貼到ppt然後又在word裏面說文解字
碼農的話比較像是一堆spring boot實例然後綁成一個spring cloud去管理

節點又有以下細分(依據我個人覺得的重要度排序)

  1. Master-eligible Node
  2. Master Node

上面這兩個在前面的文章有介紹過

  1. Data Node:

負責保存資料的節點,以及保存分片用的,如果需要分片擴展他有著重用的協調者角色

  1. Coordinating Node:

類似controller 接收各種來自kibana或應用所發起的Client,再將該請求發送到各個合適的節點

  1. Ingest Node:

拿來做資料預處理的節點,如果有index template則會減輕他的負擔,我們用logstash引了堆東西就是經過他再進庫的

  1. Machine Learning Node

這東西我就超不熟的,一般都是拿來做機器學習,這邊的機器學習不是資料探勘還是什麼的,而是訓練他讓他知道什麼情況叫“異常”


3. 分片(shard)

許多地方都出現了這個很不直觀名詞,都說有主分片與副本分片
然後不斷分片大小云云的,但究竟"分片"這個詞是什麼呢

大意大約就是將一個入口已某種規則創建多個小入口,並且禁止資料去選擇哪個入口

而是每個資料從生成那瞬間已經依據某個規則會進到那個子入口

抽象呀!什麼意思
假設今天一個國家只有一個海關,那麼只有一個入口,吞吐量就會很差
但如果依照七大洲去拆成七個入口,資料將會依據自己的規則進入某個入口

因此分片的數量與定製規則也是門學問

如果分配數量過小

那就等同一個海關,單個分片的數據會過大,導致吞吐量過低

如果分配數量過大

那就變成變成全臺灣依據鄉鎮開海關,那機場想必必須很大,甚至會有過多閒置分片造成浪費

4. 副本(Replica)

可以理解爲備份分片,或副分片,主副分片一般不會出現再同一個節點上,爲了因爲他本身就是爲了應付主分片的節點壞了,副分片可以頂上去,主要拿來容災的

ES預設主副各五,後期好像有變,大部分應用提示yellow就是因爲這貨不能寫了


手打三千多字....覺得今天可以了,打着打着默默的再標題加個(上)
明天來寫分析,DSL,ELK,doc評分機制,然後再來寫基礎操作....

報名已經結束了,不能改名不然直接把文章改成
Elasticsearch的字典集好像也不錯....
就是個應該有人整理,但訊息量過大,根本就懶的寫的主題
要查,要理解,還要整理不是略懂就可以了

狗日呀.....選了個很糟糕的文章走向呢

對於文章中的任何用詞與專業字或都可以在下面留言提問

梗圖看不懂也行

蔽農會帶着謙卑爲懷的心情竭盡所能回覆與說明的


上一篇
我們都說自己是碼農,學怎麼學種菜跟收割也是門學問-EC-kibana不看API 讓他幫我生語句(2)來建立點簡單查詢吧
下一篇
這篇來介紹關於Elastic on cloud的農具好了,關於Elastic專有名詞說文解字:基本概念篇(下)含ES資料類型
系列文
後端碼農程序猿,來寫on cloud是不是搞錯了什麼,俺想耕田呀32
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言