IT鐵人第11天 Elasticsearch 使用python匯入資料

第 12 屆 iThome 鐵人賽

DAY 11

Elastic Stack on Cloud

Python&Elasticsearch 入門系列第 11 篇

12th鐵人賽

hank9820

團隊nutc_imac_XXX

2020-09-25 13:08:43

5133 瀏覽

分享至

前幾篇的教學教大家建立了一個自己的index，有了index怎麼可以沒有doc(文檔)呢，今天就來教大家把資料匯入ES

有兩個方法可以往es裡丟資料：create、index
這兩者的差異是create需要指定id而index如果沒有指定id則會自動生成，其餘用法其實差不多，這邊用index來做示範
假設我有以下的csv

1.利用python將資料源整理成mappings的格式，例如以下：

{
    'sid': 's1090101',
    'name': '王小明',
    'age': 18,
    'class': '資工一1'
}

過程就不多做贅述

2.使用index這個方法把剛剛整理好的資料源丟進去

index

es.index(index='school_members', body=剛剛整理好的資料源)

完整程式碼在下面：

from elasticsearch import Elasticsearch

def load_datas():
    datas = list()
    with open('student.csv', 'r') as f:
        for data in f.readlines():
            sid, name, age, class_ = data.replace('\n', '').split(',')
            datas.append(
                {
                    "sid": sid,
                    "name": name,
                    "age": int(age),
                    "class": class_
                }
            )
    return datas

def create_data(es, datas):
    for data in datas:
        es.index(index='school', body=data)  

if __name__ == "__main__":
    es = Elasticsearch(hosts='192.168.1.59', port=9200)
    datas = load_datas()
    create_data(es, datas)

create:

需要給id

es.index(index='school_members', body=剛剛整理好的資料源, id=1)

delete

刪除資料

es.delete(index='school_members', id=想要刪除的文檔id)

update

更新資料
定義body：

{
    "doc": {
        "age": 20 #想更新的欄位:更新的值
    }
}

執行

es.update(index='school_members', id=想要更新的文檔id)

今天的教學就到這裡，下篇來教大家可以批量對文檔操作的方法：bulk

IT鐵人第10天 Elasticsearch 使用python建立index(2)

IT鐵人第12天 Elasticsearch 使用python匯入資料(2) bulk

系列文

Python&Elasticsearch 入門共 30 篇

RSS系列文訂閱系列文

20 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

1 則留言

kamisamakiss

iT邦新手 5 級 ‧ 2021-04-05 10:47:07

id一定是數字嗎?

回應
檢舉

登入發表回應

我要留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

Python&Elasticsearch 入門系列 第 11 篇