iT邦幫忙

2023 iThome 鐵人賽

DAY 20
1

續上一篇LLM 和機器學習的介紹-Part 4 ,我們繼續討論一些數據模型(data models)。

實體-關係模型 (Entity Relationship Model)
實體關係模型是一種用於定義指定系統的數據元素和關係的模型。
在ER建模中,數據庫結構被描述為一個稱為實體關係圖的圖表。
https://ithelp.ithome.com.tw/upload/images/20231004/20162091b9VIyES0QO.png

  • 實體:實體可以是任何對象、類、人或地方。例如:員工、部門
  • 屬性:屬性用於描述實體的特性。椭圓用於表示屬性。例如:id、年齡、聯繫號碼、姓名等可以是學生的屬性。
  • 關鍵屬性:用於表示實體的主要特徵。

這模型適合用於如果你需要釐清不同部門,行業,或群組互相的關聯性。

參考資料:https://www.javatpoint.com/dbms-er-model-concept

階層模型 (Hierarchical Model)
該模型中,較低層次按照遞增的高層次單位的層次排序。
https://ithelp.ithome.com.tw/upload/images/20231004/20162091fYViSkuPEC.png

使用階層模型進行統計的主要原因是因為一個數量的推論會影響對另一個數量的推論。在一般的線性模型中,觀察是相互獨立的。階層模型則不同,因為觀察組成了所謂的集群,而這些集群也會共享一些特性和相似之處。

例如,如果我們研究某個地區的兒童群組,我們可能會發現小孩有可能與其直系家庭中的其他小孩擁有相似的觀點和信仰,或是與社會經濟階層一樣的其他小孩相似。而不同背景的小孩則可能不會有那麼多的共同點。一個基本的線性模型,如果不考慮這些集群,從一開始就錯了。階層模型使我們能夠考慮這些集群的影響以及它們之間的互動。

參考資料:https://www.statisticshowto.com/hierarchical-model/#:~:text=A%20hierarchical%20model%20is%20a,of%20successively%20higher%2Dlevel%20units.

網絡模型 (Network Model)
網絡模型是升級版的階層模型。在這種類型的模型中,一個子節點(Child)可以與多個父節點(Parent)相關聯,這是層次數據模型不支持的功能。
https://ithelp.ithome.com.tw/upload/images/20231004/20162091rqnOGw95ga.png

  • 網絡模型的優點
    如圖中所示,網絡模型可以支持多對多的關係。 D2和C3都有多個主節點。 D2的主節點是C1和C2,而C3的主節點是B1和B2。這種方式,網絡數據模型可以處理多對多的關係(Many to Many),而層次數據模型無法處理多對多的關係。

盡管網絡模型改進了層次模型,但也把模型變得更加複雜以及難釐清。

參考資料:https://www.tutorialspoint.com/Network-Data-Model


對 dbt 或 data 有興趣?歡迎加入 dbt community 到 #local-taipei 找我們,也有實體 Meetup 請到 dbt Taipei Meetup 報名參加
Ref:

https://levelup.gitconnected.com/20-pandas-functions-for-80-of-your-data-science-tasks-b610c8bfe63c


上一篇
LLM 和機器學習的介紹-Part 4
下一篇
機器學習 挑戰 - Day 0
系列文
資料分析的硬體以及軟體學習以及成長心得30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言