第 12 屆 iThome 鐵人賽

DAY 28

Elastic Stack on Cloud

後端碼農程序猿，來寫on cloud是不是搞錯了什麼，俺想耕田呀系列第 28 篇

EC的農地辣麼大，作物辣麼多，來認真找作物了（1）ES的逐一說文解字-搜尋

12th鐵人賽

theRookie

2020-10-13 09:13:14

1834 瀏覽

分享至

來到第28天了，卻覺得頭很痛
ES的收尋知識點有點大，要細講自己也講不清楚
要粗講，可能又講的不清楚

我的老天那

最後幾篇，文思枯竭，那麼我們就直接開始囉~

本篇參考文章

ES小農經過小小的到處東找西查，最後還是覺得官網最詳細，只可惜大量英文....
（中文版只有更新到2.x...看過就覺得直接打上來，可能很多都廢棄了）

官網基本將ES的收尋簡單分成了五個單元
今天小農就依照這五個單元簡單一次就入門吧~

1. 搜尋基礎

參考文檔

1.1 query context
    * 會對搜尋進行算分(_score)
    * 使用query關鍵包裹詞語
      1. must: 必須符合
      2. should: 選擇性符合
      3. must_not: 必須不符合 
2.2 filter context
    * 不會對搜尋進行算分，但能夠利用暫存更快速取得資料
      1. 必須符合

範例語句:

GET /{index}/_search
{
    "query":{
        "bool":{
            //1. 必須住在新北市
            "must":{
                "term":{
                    "city":"New Taipei City"
                }
            },
            //2. 年紀必須大於等於35
            "must_not":[
                {
                    "range":{
                        "age":{
                            "gte":"30"
                        }
                    }
                }
            ],
            //3. 名字中有Tsai,Jolin,之中一個即可，符合越多分數越高
            "should":[
                {
                    "term":{
                        "name":"Tsai",
                    }
                },
                {
                    "term":{
                        "name":"Jolin",
                    }
                }
            ],
            //4. 必須爲女性
             "filter":{
                "term":{
                    "sex":"women"
                }
            }
        }
    }
}

2. 分詞(Full text queries)

參考文檔

2.1. match 
    * 將搜索語句經過分詞後進行"OR"查詢
2.2. match_phrase 
    * 將搜索語句經過分詞後，按照分詞順訊進行"and"搜尋，且可使用slop容許分詞間中間間格幾個詞
     （就是分詞全要有，且順序要對)
2.3. match_phrase_prefix 
    * 對最後一個分詞進行通配符搜索，並且可使用max_expansions來設定糢糊比對數控制
      其中 max_expansions 最小爲1
2.4. multi_match
    * match的多組版本，將每組內容都進行分詞後進行"OR"查詢
2.5. common terms
    * 對不常見的指定分詞給與更高的算分
2.6. query_string
    * 允許在單個查詢字串中使用and,or,not進行多字段搜索
2.7. simple_query_string
    * 像前面單元的lucene，直接將語句進行搜尋

三個很像的來點小栗子吧

我們假設資料爲以下

{ "id" : 1,"content":"國慶快樂,我愛臺灣" }
{ "id" : 2,"content":"我愛臺灣,國慶快樂" }
{ "id" : 3,"content":"愛臺灣,國慶快樂" }
{ "id" : 4,"content":"國慶快樂,全國愛臺灣" }

match

{
  "query":{
    "match":{
      "content.ik_smart_analyzer":"國慶快樂"
    }
  }
}
==
mysql where keyWork = 國慶 or keyWork = 快樂

match_phrase

{
    "query": {
        "match_phrase": {
            "content.ik_smart_analyzer": {
            	"query": "快樂我愛",
            	"slop":1
            }
        }
    }
}
==
mysql where keyWork = 國慶 and 國慶_Position=0 and keyWork = 我愛 and 我愛_Position=1

match_phrase_prefix

{
  "query": {
    "match_phrase_prefix": {
      "content.ik_smart_analyzer": {
        "query": "臺",
        "max_expansions": 1
      }
    }
  }
}
===
mysql where keyWord = 臺 or keyWord like “臺?”

3. 精確比對(Term-level queries)

將搜尋語句進行"分詞"的完全配對搜索

{ "id" : 1,"content":"國慶快樂,我愛臺灣" }
{ "id" : 2,"content":"我愛臺灣,國慶快樂" }
{ "id" : 3,"content":"愛臺灣,國慶快樂" }
{ "id" : 4,"content":"國慶快樂,全國愛臺灣" }

參考文檔

3.1. term 
    搜索詞不會被分詞，必須完全符合

//查無資料因爲沒有分詞:國慶快樂,我愛臺灣
{
  "query": {
    "term" : { "content" : "國慶快樂,我愛臺灣" }
  }
}
//id:1~4皆會查出
{
  "query": {
    "term" : { "content" : "臺灣" }
  }
}

3.2. terms 
    等於mysql "in" 將所有該屬性符合配對都找出

//id:1~4皆會查出
{
  "query": {
    "terms" : { "content" : ["國慶","臺灣"]}
  }
}

3.3. terms_set
    至少符合一個或多個分詞字段
3.4. range 
    ## //第29篇 基礎搜尋的進階說明
3.5. exists 
    查詢某個屬性不爲空的資料

"query": {
    "exists" : { "field" : "content" }
}

3.6. prefix 
    直接搜尋以某字段開頭的資料

"query": {
    "prefix" : { "content": "國" }
}
//==sql where content like "國%”

3.7. wildcard

"query": {
    "wildcard" : { "content": "*國" }
}
//==sql where content like "%國”
"query": {
    "wildcard" : { "content": "國?" }
}
//where author like "國_”

3.8. regexp 
3.9. fuzzy 
    拼字錯誤或容錯查詢

"query": {
    "fuzzy" : {
        "author": {
            "value": "我礙臺灣",
            "fuzziness": 1,//最大錯別字長度
            "prefix_length": 1,//開頭至少要對幾個字
            "max_expansions": 100//最多搜尋結果
        }
    }
}

3.10. type 
    7.x被棄用，可能以後被刪除
3.11. ids 
    依據多個id[]來檢索文檔

原本想將五類都打完
明天來詳講range的花式用法
bool到底是什麼
然後一些常用api吧~

對於文章中的任何用詞與專業字或都可以在下面留言提問

梗圖看不懂也行

蔽農會帶着謙卑爲懷的心情竭盡所能回覆與說明的

這篇來介紹關於Elastic on cloud的農具好了，關於Elastic專有名詞說文解字：基本操作篇(上)索引(index)與資料(doc)的增刪改查(CURD)

EC的農地辣麼大，作物辣麼多，來認真找作物了（2）ES的逐一說文解字-Range & 常用的旁支末節

系列文

後端碼農程序猿，來寫on cloud是不是搞錯了什麼，俺想耕田呀共 32 篇

RSS系列文訂閱系列文

39 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19856 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

後端碼農程序猿，來寫on cloud是不是搞錯了什麼，俺想耕田呀系列 第 28 篇

EC的農地辣麼大，作物辣麼多，來認真找作物了（1）ES的逐一說文解字-搜尋

最後幾篇，文思枯竭，那麼我們就直接開始囉~

1. 搜尋基礎

2. 分詞(Full text queries)

三個很像的來點小栗子吧

我們假設資料爲以下

match

match_phrase

match_phrase_prefix

3. 精確比對(Term-level queries)

對於文章中的任何用詞與專業字或都可以在下面留言提問

梗圖看不懂也行

蔽農會帶着謙卑爲懷的心情竭盡所能回覆與說明的

尚未有邦友留言

標記使用者

後端碼農程序猿，來寫on cloud是不是搞錯了什麼，俺想耕田呀系列第 28 篇