本篇一樣將會介紹Kaggle 文章大大,也是取材至某個大大上,https://www.kaggle.com/sharmasanthosh/exploratory-study-on-ml-algorithms 大家也可以去支持支持,那我們廢話不多說,就給他看下去。
import warnings
warnings.filterwarnings('ignore')
import pandas #provides data structures to quickly analyze data
dataset = pandas.read_csv("../input/train.csv")
dataset_test = pandas.read_csv("../input/test.csv")
ID = dataset_test['id']
dataset_test.drop('id',axis=1,inplace=True)
pandas.set_option('display.max_rows', None)
pandas.set_option('display.max_columns', None)
print(dataset.head(5))
以上程式碼在這些之前事實上有一大串的說明,但是我直接刪去,各位可以參考以上所貼的網址去了解,在這裡我會簡單的概述,事實上這裡也是為了做機器學習的動作而一個程式,為了探討機器學習這個演算法,而做的一個實驗。
import numpy
import seaborn as sns
import matplotlib.pyplot as plt
split = 116
size = 15
data=dataset.iloc[:,split:]
cols=data.columns
n_cols = 2
n_rows = 7
for i in range(n_rows):
fg,ax = plt.subplots(nrows=1,ncols=n_cols,figsize=(12, 8))
for j in range(n_cols):
sns.violinplot(y=cols[i*n_cols+j], data=dataset, ax=ax[j])
接下來利用各項圖形化模組以及運算模組來將得來的資料來做一個圖形整理,並且後面就採取 Scikit-Learning 方式來進行分類採樣,因為後面大概一大段都是跟之前有介紹些許相同,所以本人將直接使用說明方式帶過,事實上這些東西再前面的運算及分類上已經有達到預判以及測試的過程,有明確的圖形,以及明確的數值呈現,但是當我們將這些很明確的東西透過 Scikit來完成時會發現更加的完美,所以這也是告訴我們,即使我們所使用的功能多麼好,寫的演算法多麼厲害,但是如果不針對相對應的模組使用,可能會無法展現出這個程式所彙整的資料好壞。
謝謝大家觀看,以上為不專業的AI介紹,那我們下篇見~~~~~