學習透過 API 進行查詢: 星星數大於2000?

第 12 屆 iThome 鐵人賽

DAY 3

Elastic Stack on Cloud

Elastic 30天自我修行系列第 3 篇

12th鐵人賽

bear999

2020-09-03 21:28:29

1827 瀏覽

分享至

經過昨天使用 Web GUI介面，快速匯入第一個JSON檔後。在 Elastic Stack on Cluod 的網頁中，翻來翻去，就是找不到新增第2個JSON資料的選項。後來查詢網路文件後，發現需要透過API才可以直接將第2個JSON檔案直接追加在第1個JSON檔案之後。想想也是，Elastic是企業級的應用，在實務狀況中，如果每天有新資料需要被匯入，不可能一直透過人機互動方式進行資料的CURD，必然是透過程式的方式進行。

查閱了一下文件，Elastic提供了好多的API，各司其職；今天就先簡單一點，瞭解如何透過 API 進行資料的查詢 (Query)。而在進行資料的查閱前，就先讓我們以關聯式資料庫的術語，來觸類旁通，瞭解 Elastic Search 中的各式術語。

Index 索引：
想像成是關聯式資料庫的Database。
在昨天上傳第一個 JSON 檔時，Elastic Stack on Cluod要求我為 Index 進行命名。我命名為："elastic_json"。這缺乏想像力所導致的爛命名... 後續我可以再實作更改Index名稱，平常在公司一定不能這樣亂玩。
Fields 欄位：
Fields:想像成是關聯式資料庫的Columns。舉例來說：昨天上傳的資料，總計有120個Fields。也像關聯式資料庫一樣，不同的Columns會有不同的資料型別。像有的資料可能是整數、日期時間、或是文字。而此處是直接由Elastic Stack on Cluod進行判斷，而資料型別自然是可以再視實際狀況進行修正

有了這最簡單的認識後，就可以開始進行 API 的查詢。如果我們今天想要查詢 elastic 在 Github 中，星星數大於2000的 repos 有幾個呢? 如果是在資料式資料庫，我們可能會這樣進行查詢

Select * from elastic_json where stargazers_count > 2000;

我們直接透過網頁上的 API Console 進行查詢

此處可以看到，過濾條件 stargazers_count > 2000 的API寫作方式。

另外在 SQL 有時我們只需要聚合值，像是資料的筆數：

Select count(*) from elastic_json where stargazers_count > 2000;

而在此處，就可以直接透過 API 回傳的資料進行判讀，星星數大於2000的有2筆資料

"total": {
      "relation": "eq",
      "value": 2
    },
    "max_score": 1
  }

官方的API文件，非常詳細。
不過對於初學者來說，可以先參考這個網頁的實例介紹進行學習 https://dzone.com/articles/23-useful-elasticsearch-example-queries 以免心生挫折...

這是我第一次學習 ElasticSearch 很多在關聯式資料庫的概念無法直接適用，需要時間進行調整。畢竟鐵人賽可是足足有30天，相信接下來一定可以把每天學習結果，由點連接成線!

匯入 JSON 檔: Via Github API

利用R進行查詢: 星星數大於2000?

系列文

Elastic 30天自我修行共 31 篇

RSS系列文訂閱系列文

11 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

AI會議轉錄如何盡可能縮小明文攻擊面？

IT邦幫忙

Elastic 30天自我修行系列 第 3 篇