iT邦幫忙

2017 iT 邦幫忙鐵人賽
DAY 13
1
Big Data

30天之你好MongoDB系列 第 13

30-13之索引(3)---比較特別的索引使用

  • 分享至 

  • xImage
  •  

黑色好看版 - 傳送門


本篇文章將要說明幾個比較特別索引使用的方法。

  • 索引陣列欄位
  • 索引子欄位
  • 全文索引

P.S 快要一半囉~~+u^13

~ 索引陣列欄位 ~


假設你有下列資料,但發現搜尋fans裡的值很慢,你想要建立索引,要著麼建呢?

{ "name" : "mark" , "fans" : ["steven","jack","mmark"]}
{ "name" : "steven" , "fans" : ["max","jack","mmark"]}
{ "name" : "jack" , "fans" : ["steven","hello","mmark"]}

事實上就和之前幾篇建立索引一樣。

db.user.ensureIndex({"fans":1})

那我們在再假設資料如下。

{ "name" : "mark" , 
  "fans" : [ 
    {"name" : "a" , "age" :11},
    {"name" : "b" , "age" :10},
    {"name" : "c" , "age" :21},
  ]
},
{ "name" : "steven" , 
  "fans" : [ 
    {"name" : "e" , "age" :10},
    {"name" : "f" , "age" :20},
    {"name" : "c" , "age" :21},
  ]
}

這時如果我們建立fans裡的name為索引,指令會如下。

db.user.ensureIndex({"fans.name":1})

通過以上的方法就可以很簡單的將陣列欄位建立索引,但要是有幾點要注意。

  • 陣列索引的代價比一般的索引高,因為它需要更新的更多。
  • 一個索引中的陣列只能有一個,這是為了避免索引爆炸性增長。

根據第二個注意點,我們來解釋一下,假設你有一個索引為{ "a" : 1 , "b" : 1 }
那麼下表會列出他的合法與否。

資料 合法與否
db.test.insert({ "a" : 1, "b" : 2 }) OK
db.test.insert({ "a" : [1,2,3] , "b" : 2 }) OK
db.test.insert({ "a" : [1,2,3] , "b" : [1,2,3]}) NO

因為如果an個元素,而bm個元素,那索引就會建立n * m個索引列表,會爆炸,所以才有這限制。

~ 索引子欄位 ~


假設有下列資料。

{ "name" : "mark",
  "address" : {
     "city" : "taipei",
     "zip" : 100,
  }
}

如果我們需要在city這子欄位上建立索引,可下達該指令。

db.user.ensureIndex({"address.city" : 1})

注意,{"address" : 1}{"address.city" : 1}這兩種是不同的,
對主欄位建立索引,只能用下列指令,才能使用索引進行查詢。

db.user.find({ "address" : { "city" : "taipei" , "zip" : 100 }})

而無法使用如下的搜尋,除非索引為{"address.city" : 1}

db.user.find( {"address.city" : "taipei" })

~ 全文索引 ~


mongodb中有一種專門用來搜尋全文的索引,前面有一篇有說到可以用正規表達式來進行搜尋,但它的缺點就在於大型全文的速度會非常慢,而且無法處理語言的理解。

以下有兩點要注意。

  • 創建全文索引的成本非常高,建議是在離線狀況下建立全文索引。
  • 目前不支援中文。

全文索引使用方法

假設測試資料如下。

{
   "id" : 1,
   "post_content" : "Indexes support the efficient execution of queries 
    		      in MongoDB"
},
{
   "id" : 2,
   "post_content" : "MongoDB can use the index to limit the number of
                  documents it must inspect."

},
{
	"id" : 3,
	"post_content" : "hello word"
}

然後我們來建立全文索引。

db.posts.ensureIndex({post_content:"text"})

當建立好索引後,我們就可以使用索引來進行搜尋,例如我們想要找出有包含mongodb單詞的文章。

db.posts.find({ "$text" : { "$search" : "mongodb" }})

執行結果如下,找到了兩筆,並且可以知道在全文索引中是不分大小寫的。

而如你想要精確的查詢例如尋找mongodb can,則可以用雙引號括起來,如下。

db.posts.find({ "$text" : { "$search" : "\"mongodb can\"" }})

結果如下。

想要尋找mongodbworddocument,則使用下面的搜尋式。

db.posts.find({ "$text" : { "$search" : "mongodb word" }})

結果如下,呃不小心多建立一個id:3

~ 結語 ~


今天這篇簡單的說明下幾個比較特別但卻常用的索引,其中全文索引這邊事實上蠻多人不推用mongodb來建立索引,主因還是因為中文的關係,大部份還是建議用elasticseachSphinxelasticsearch是真的不錯用,很多單詞都會解析,速度也快,目前在全文索引中還真看不出mongodb有啥優勢的~個人感想~

~ 參考資料 ~



上一篇
30-12之索引(2)---複合索引的坑
下一篇
30-14之聚合(1)---Aggregate Framework的哩哩扣扣
系列文
30天之你好MongoDB30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言