圖片來源:(https://acg.gamer.com.tw/acgDetail.php?s=71979)
圖片來源:(https://en.wikipedia.org/wiki/Scikit-learn)
是一個Python機器學習庫,建立在NumPy、SciPy、 matplotlib 上。提供一系列簡單而高效的工具,用於數據挖掘和數據分析。Scikit-learn 設計強調可重複使用性,使用者可以在各種環境中重複使用
分類
:邏輯迴歸、支持向量機、決策樹、隨機森林、K近鄰迴歸
:線性迴歸、多項式迴歸、嶺迴歸、Lasso迴歸聚類
:K-Means、DBSCAN、層次聚類降維
:PCA、t-SNE預測
:房價預測、股票價格預測分類
:垃圾郵件分類、疾病診斷聚類
:客戶分群、圖片聚類from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
# 載入鳶尾花數據集
iris = datasets.load_iris()
X = iris.data
y = iris.target
# 分割數據集為訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=0)
# 建立支持向量機模型
clf = SVC(kernel='linear')
# 訓練模型
clf.fit(X_train, y_train)
# 評估模型
accuracy = clf.score(X_test, y_test)
print('Accuracy:', accuracy)
載入數據集
:使用 datasets.load_iris()
載入鳶尾花數據集分割數據集
:將數據集分割為訓練集和測試集建立模型
:使用 SVC
建立一個線性核的支持向量機模型訓練模型
:使用 fit()
方法訓練模型評估模型
:使用 score()
方法評估模型在測試集上的準確率
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_te
st_split
# 產生隨機數據
X = np.random.rand(100, 1)
y = 2 * X + 1 + 0.1 * np.random.randn(100, 1)
# 分割數據集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 建立線性回歸模型
model = LinearRegression()
# 訓練模型
model.fit(X_train, y_train)
# 預測
y_pred = model.predict(X_test)
# 評估模型
print('係數:', model.coef_)
print('截距:', model.intercept_)
圖片來源:(https://kknews.cc/comic/e6r3j8y.html)
資料來源:scikit-learn