續上一篇LLM 和機器學習的介紹-Part 4 ,我們繼續討論一些數據模型(data models)。
實體-關係模型 (Entity Relationship Model)
實體關係模型是一種用於定義指定系統的數據元素和關係的模型。
在ER建模中,數據庫結構被描述為一個稱為實體關係圖的圖表。
這模型適合用於如果你需要釐清不同部門,行業,或群組互相的關聯性。
參考資料:https://www.javatpoint.com/dbms-er-model-concept
階層模型 (Hierarchical Model)
該模型中,較低層次按照遞增的高層次單位的層次排序。
使用階層模型進行統計的主要原因是因為一個數量的推論會影響對另一個數量的推論。在一般的線性模型中,觀察是相互獨立的。階層模型則不同,因為觀察組成了所謂的集群,而這些集群也會共享一些特性和相似之處。
例如,如果我們研究某個地區的兒童群組,我們可能會發現小孩有可能與其直系家庭中的其他小孩擁有相似的觀點和信仰,或是與社會經濟階層一樣的其他小孩相似。而不同背景的小孩則可能不會有那麼多的共同點。一個基本的線性模型,如果不考慮這些集群,從一開始就錯了。階層模型使我們能夠考慮這些集群的影響以及它們之間的互動。
參考資料:https://www.statisticshowto.com/hierarchical-model/#:~:text=A%20hierarchical%20model%20is%20a,of%20successively%20higher%2Dlevel%20units.
網絡模型 (Network Model)
網絡模型是升級版的階層模型。在這種類型的模型中,一個子節點(Child)可以與多個父節點(Parent)相關聯,這是層次數據模型不支持的功能。
盡管網絡模型改進了層次模型,但也把模型變得更加複雜以及難釐清。
參考資料:https://www.tutorialspoint.com/Network-Data-Model
對 dbt 或 data 有興趣?歡迎加入 dbt community 到 #local-taipei 找我們,也有實體 Meetup 請到 dbt Taipei Meetup 報名參加
Ref:
https://levelup.gitconnected.com/20-pandas-functions-for-80-of-your-data-science-tasks-b610c8bfe63c