iT邦幫忙

2023 iThome 鐵人賽

DAY 8
0
AI & Data

圍繞 AI & Data 的主題系列 第 8

[Day 8] 數據挖掘 (Data Mining)

  • 分享至 

  • xImage
  •  

Hello 大家好!歡迎回來!前三天剛剛分享完資料視覺化 (Data Visualization),那今天我打算跟大家分享數據挖掘 (Data Mining)。事不宜遲,現在開始!

簡介

數據挖掘 (data mining) 是一個跨學科的電腦科學分支 。它是用人工智能、機器學習、統計學和資料庫的交叉方法在相對較大型的數據集中發現模式的計算過程。數據挖掘是從大量資料中發現隱藏的模式、關係和洞察力的過程。它涉及應用各種演算法和統計技術,從中提取有價值的知識,而這些知識可用於決策、預測和優化。數據挖掘有助於探索龐大的資料集,揭示通過傳統分析可能不明顯的寶貴資訊。
https://ithelp.ithome.com.tw/upload/images/20230918/20163226d737K8X7Fz.png

關鍵技術

  1. 關聯規劃探勘 (Association Plan Mining)
    關聯規則探勘識別數據集中一組項目之間的有趣關聯或關係。它有助於揭示模式,例如「購買產品 A 的人可能會再購買產品 B」 == 購買原子筆的人可能會購買筆芯。
  2. 分類與預測
    分類是一種根據屬性將數據分配到預定類別的技術。預測則使用歷史數據對未來結果進行預測。
  3. 聚類 (cluster analyse)
    把相似的對象通過靜態分類的方法分成不同的組別或者更多的子集 (subset),這樣讓在同一個子集中的對象都有相似的一些屬性。
  4. 異常檢測 (anomaly detection)
    異常檢測專注於識別與常態明顯偏離的罕見或異常數據實例。它對於詐騙檢測、網絡入侵檢測和識別資料集中的異常值非常有用。
  5. 文本探勘 (text mining)
    文字處理過程中產生高質素的資訊,例如情感分析主題建模文本分類 等等。

過程

  1. 資料收集
    透過不同網站、媒體、資料庫 (database) 搜集資料。
  2. 資料預處理
    清理/刪除、整理重複、不一致的資料。
  3. 資料轉換
    轉換資料的合適的格式,並編寫程式。
  4. 資料建模
    運用統計圖、機器學習等方式挖掘資料中的關聯性。
  5. 評估和驗證
    透過多次統計和評估,以提升準確度。
  6. 解釋和展示
    透過圖表、簡報等 (資料視覺化工具) 工具,展示探勘結果

應用

  • 商業智能
    資料探勘在商業智能中發揮關鍵作用,揭示市場趨勢、客戶行為模式,並識別交叉銷售機會。
  • 醫療保健
    資料探勘有助於分析病人記錄,識別疾病模式,預測治療結果
  • 金融
    在金融領域中,資料探勘用於信用評分、詐騙檢測、股市分析和風險評估。
  • etc...

參考資料

我是 Mr. cobble,明天見!


上一篇
[Day 7] 資料視覺化 (Data Visualization) (下)
下一篇
[Day 9] 圖像識別 (Image Recognition)
系列文
圍繞 AI & Data 的主題30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言