前言
昨天我們完成資料前處理與特徵工程,現在已經有乾淨且規範的資料可以使用。今天將進入核心步驟:建立邏輯迴歸模型,讓模型學習特徵與目標之間的關係。
一、建立邏輯迴歸模型
from sklearn.linear_model import LogisticRegression
# 建立模型
model = LogisticRegression()
# 用訓練集進行模型訓練
model.fit(X_train, y_train)
說明:
二、初步評估模型
from sklearn.metrics import accuracy_score
# 預測測試集
y_pred = model.predict(X_test)
# 計算準確率
accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
說明:
三、使用模型進行單筆資料預測
# 隨便挑一筆測試資料,這裡選第一筆
sample_X = X_test[0].reshape(1, -1) # reshape成 (1, 特徵數量)
sample_y = y_test.iloc[0] # 用 iloc 取位置,避免 KeyError
# 顯示輸入特徵值
print("輸入特徵值:")
print(sample_X)
# 使用模型進行預測
sample_pred = model.predict(sample_X)
# 顯示結果
print("真實值:", sample_y)
print("模型預測:", sample_pred[0])
說明:
印出的結果可以看到 模型認為這筆資料是良性還是惡性,再跟真實值比較。
小結
今天我們完成了邏輯迴歸模型的建立,並試著用它來預測單筆資料。雖然我們沒有手動調整任何內部數值,模型已經能自動學習特徵的重要性。
後續章節,我們會介紹更多模型設定的方式,幫助模型學得更準確,也會說明其他評估模型的方法,讓我們能更全面地了解模型的表現。