iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0

1.這個平台到底要做什麼?
這個平台的核心任務是:
• 收集癌症相關資料:包括臨床數據(像是AFP指數、治療階段)、病人自我紀錄(睡眠、疼痛、心情),以及AI預測結果(復發風險、生存率)。
• 整理乾淨:很多資料會有缺漏或格式亂掉,所以需要清洗處理。
• AI分析:把模型的輸出數據也加進來。
• 視覺化呈現:最後用Grafana Dashboard把資料「變成一眼能懂的圖表」。

換句話說,這個平台就是要把「原始資料 → 清洗 → AI處理 → 視覺化」。

2. 癌症資料的挑戰:為什麼需要清洗?
以癌症患者的資料來說,常見的問題有:
• 缺漏值:有些病人的檢驗紀錄不完整。
• 格式不一:日期有的寫2025/9/10,有的寫2025-09-11。
• 數據混雜:既有數值(AFP=200)、文字(心情=焦慮)、分類(治療階段=化療)。

底下用一小段Python,示範怎麼把這些資料清理乾淨。

import pandas as pd
import numpy as np

data = {
    "date": ["2025/9/10", "2025-09-11", None],
    "AFP": [200, None, 150],
    "sleep_hours": [6, 4, None],
    "mood": ["焦慮", "沮喪", "平靜"]
}
df = pd.DataFrame(data)

# 日期格式處理
df["date"] = pd.to_datetime(df["date"], errors="coerce")

# 補缺值
df["AFP"] = df["AFP"].fillna(df["AFP"].mean())
df["sleep_hours"] = df["sleep_hours"].fillna(df["sleep_hours"].median())
print(df)

3.為什麼選 Grafana + Loki?
市面上有很多資料分析工具,像是ELK Stack、Tableau、用Python畫圖。
但我最後還是挑了Grafana + Loki,因為Grafana除了介面漂亮、功能強大,還能夠很快做出各種Dashboard;Loki則是專門處理log型態資料,對JSON特別友好,很適合我模擬癌症病人每天的狀態紀錄;最後Promtail是一個收集器,能自動把我生成的log丟到Loki,不需要每天手動匯入資料。


上一篇
肝癌資料視覺化與 AI 平台的研究動機與學習目標
下一篇
平台架構設計 – 癌症資料怎麼一路走到 Dashboard?
系列文
用 Grafana 打造癌症資料視覺化平台:從資料清洗到AI預測呈現5
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言