iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 15
0

之前說為什麼統計學要用Python?
[R是一門專注於統計學的語言.Python是帶有統計學模塊的通用編程語言.R比的Python有更多的統計分析功能,以及專用的語法。但是,當面對構建複雜的分析管道,混合統計學以及例如圖像分析,文本挖掘或者物理實驗控制,Python中的富有就是物價的優勢。
例如有:
數據表徵和交互
數據作為表格
熊貓數據框架
假設檢驗:對比兩個組
配對實驗:對同一個體的重複測量
線性模型,多因素和方差分析
用“公式”來在Python中指定統計模型
多元回歸:包含多元素
事後假設檢驗:方差分析(ANOVA)
更多的可視化:用seaborn來進行統計學探索
配對圖:散點矩陣
lmplot:繪製一個單變量回歸

數據作為表格
統計分析中我們關注的設定是通過一組不同的屬性或特徵來描述多個觀察或樣本。然後這個數據可以被視為二維表格,或矩陣,列是數據的不同屬性來是觀察
之前說過的pandas跟data-frame,我們將會在來自pandas模塊的pandas.DataFrame中存儲和操作這個數據。它是電子表格程序在Python中的一個等價物。它與2D numpy數據的區別在於列帶有名字,可以在列中存儲混合的數據類型,並且有精妙的選擇和透視表機制

import pandas
data = pandas.read_csv('examples/brain_size.csv', sep=';', na_values=".")
data
#來選取檔案然後呈現表格

從數組中創建:pandas.DataFrame也可以視為1D序列,例如數組或列表的字典,如果我們有3個numpy數組:

import numpy as np
t = np.linspace(-6, 6, 20)
sin_t = np.sin(t)
cos_t = np.cos(t)

我們可以將它寫成pandas.DataFrame:

pandas.DataFrame({'t': t, 'sin': sin_t, 'cos': cos_t})

最後我們data.shape可以知道(幾,幾列)
print(data['想查詢的資料'])
其實還有許多功能比方說可以有數據點陣圖之類,這裡就不多作介紹


上一篇
14python網路
下一篇
16python random
系列文
30天自學 python應用30

尚未有邦友留言

立即登入留言